block, bfq: preserve a low latency also with NCQ-capable drives
authorPaolo Valente <paolo.valente@linaro.org>
Wed, 12 Apr 2017 16:23:14 +0000 (18:23 +0200)
committerJens Axboe <axboe@fb.com>
Wed, 19 Apr 2017 14:30:26 +0000 (08:30 -0600)
I/O schedulers typically allow NCQ-capable drives to prefetch I/O
requests, as NCQ boosts the throughput exactly by prefetching and
internally reordering requests.

Unfortunately, as discussed in detail and shown experimentally in [1],
this may cause fairness and latency guarantees to be violated. The
main problem is that the internal scheduler of an NCQ-capable drive
may postpone the service of some unlucky (prefetched) requests as long
as it deems serving other requests more appropriate to boost the
throughput.

This patch addresses this issue by not disabling device idling for
weight-raised queues, even if the device supports NCQ. This allows BFQ
to start serving a new queue, and therefore allows the drive to
prefetch new requests, only after the idling timeout expires. At that
time, all the outstanding requests of the expired queue have been most
certainly served.

[1] P. Valente and M. Andreolini, "Improving Application
    Responsiveness with the BFQ Disk I/O Scheduler", Proceedings of
    the 5th Annual International Systems and Storage Conference
    (SYSTOR '12), June 2012.
    Slightly extended version:
    http://algogroup.unimore.it/people/paolo/disk_sched/bfq-v1-suite-
results.pdf

Signed-off-by: Paolo Valente <paolo.valente@linaro.org>
Signed-off-by: Arianna Avanzini <avanzini.arianna@gmail.com>
Signed-off-by: Jens Axboe <axboe@fb.com>
block/bfq-iosched.c

index 7f94ad3fa9f8da4c104516c03d131b6e5fc9b7ad..574a5f6a2370f62d02203029845f65705affc6bb 100644 (file)
@@ -6233,7 +6233,8 @@ static void bfq_update_idle_window(struct bfq_data *bfqd,
 
        if (atomic_read(&bic->icq.ioc->active_ref) == 0 ||
            bfqd->bfq_slice_idle == 0 ||
-               (bfqd->hw_tag && BFQQ_SEEKY(bfqq)))
+               (bfqd->hw_tag && BFQQ_SEEKY(bfqq) &&
+                       bfqq->wr_coeff == 1))
                enable_idle = 0;
        else if (bfq_sample_valid(bfqq->ttime.ttime_samples)) {
                if (bfqq->ttime.ttime_mean > bfqd->bfq_slice_idle &&