drm/i915/execlists: Direct submission of new requests (avoid tasklet/ksoftirqd)

author Chris Wilson <chris@chris-wilson.co.uk>

Thu, 28 Jun 2018 20:12:11 +0000 (21:12 +0100)

committer Chris Wilson <chris@chris-wilson.co.uk>

Thu, 28 Jun 2018 21:55:10 +0000 (22:55 +0100)
author Chris Wilson <chris@chris-wilson.co.uk>
Thu, 28 Jun 2018 20:12:11 +0000 (21:12 +0100)
committer Chris Wilson <chris@chris-wilson.co.uk>
Thu, 28 Jun 2018 21:55:10 +0000 (22:55 +0100)
diff --git a/drivers/gpu/drm/i915/i915_gem.h b/drivers/gpu/drm/i915/i915_gem.h

index 261da577829a61b1c84ae8ab2d91bc6d307a6e0d..e465929568726c31a39dfb6037da594c1a93f3ac 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem.h
+++ b/drivers/gpu/drm/i915/i915_gem.h
@@ -88,4 +88,9 @@ static inline void __tasklet_enable_sync_once(struct tasklet_struct *t)
                 tasklet_kill(t);
  }
  
+static inline bool __tasklet_is_enabled(const struct tasklet_struct *t)
+{
+       return !atomic_read(&t->count);
+}
+
  #endif /* __I915_GEM_H__ */
diff --git a/drivers/gpu/drm/i915/intel_engine_cs.c b/drivers/gpu/drm/i915/intel_engine_cs.c

index ace93958689ef78528e0df8de8d0da47c02fd096..01862884a4360f6bedbb211c448fa2cce454e943 100644 (file)
--- a/drivers/gpu/drm/i915/intel_engine_cs.c
+++ b/drivers/gpu/drm/i915/intel_engine_cs.c
@@ -1619,8 +1619,8 @@ int intel_enable_engine_stats(struct intel_engine_cs *engine)
         if (!intel_engine_supports_stats(engine))
                 return -ENODEV;
  
-       tasklet_disable(&execlists->tasklet);
-       write_seqlock_irqsave(&engine->stats.lock, flags);
+       spin_lock_irqsave(&engine->timeline.lock, flags);
+       write_seqlock(&engine->stats.lock);
  
         if (unlikely(engine->stats.enabled == ~0)) {
                 err = -EBUSY;
@@ -1644,8 +1644,8 @@ int intel_enable_engine_stats(struct intel_engine_cs *engine)
         }
  
  unlock:
-       write_sequnlock_irqrestore(&engine->stats.lock, flags);
-       tasklet_enable(&execlists->tasklet);
+       write_sequnlock(&engine->stats.lock);
+       spin_unlock_irqrestore(&engine->timeline.lock, flags);
  
         return err;
  }
diff --git a/drivers/gpu/drm/i915/intel_lrc.c b/drivers/gpu/drm/i915/intel_lrc.c

index d835da128a172e5f8fb80d6e85081b5555d6b638..6ab6ddb103d128fb2bed3fb2df76e6b249748af4 100644 (file)
--- a/drivers/gpu/drm/i915/intel_lrc.c
+++ b/drivers/gpu/drm/i915/intel_lrc.c
@@ -563,12 +563,14 @@ static void complete_preempt_context(struct intel_engine_execlists *execlists)
         GEM_BUG_ON(!execlists_is_active(execlists, EXECLISTS_ACTIVE_PREEMPT));
  
         execlists_cancel_port_requests(execlists);
-       execlists_unwind_incomplete_requests(execlists);
+       __unwind_incomplete_requests(container_of(execlists,
+                                                 struct intel_engine_cs,
+                                                 execlists));
  
         execlists_clear_active(execlists, EXECLISTS_ACTIVE_PREEMPT);
  }
  
-static void __execlists_dequeue(struct intel_engine_cs *engine)
+static void execlists_dequeue(struct intel_engine_cs *engine)
  {
         struct intel_engine_execlists * const execlists = &engine->execlists;
         struct execlist_port *port = execlists->port;
@@ -578,9 +580,8 @@ static void __execlists_dequeue(struct intel_engine_cs *engine)
         struct rb_node *rb;
         bool submit = false;
  
-       lockdep_assert_held(&engine->timeline.lock);
-
-       /* Hardware submission is through 2 ports. Conceptually each port
+       /*
+        * Hardware submission is through 2 ports. Conceptually each port
          * has a (RING_START, RING_HEAD, RING_TAIL) tuple. RING_START is
          * static for a context, and unique to each, so we only execute
          * requests belonging to a single context from each ring. RING_HEAD
@@ -770,15 +771,6 @@ done:
                    !port_isset(engine->execlists.port));
  }
  
-static void execlists_dequeue(struct intel_engine_cs *engine)
-{
-       unsigned long flags;
-
-       spin_lock_irqsave(&engine->timeline.lock, flags);
-       __execlists_dequeue(engine);
-       spin_unlock_irqrestore(&engine->timeline.lock, flags);
-}
-
  void
  execlists_cancel_port_requests(struct intel_engine_execlists * const execlists)
  {
@@ -958,6 +950,12 @@ static void execlists_cancel_requests(struct intel_engine_cs *engine)
         spin_unlock_irqrestore(&engine->timeline.lock, flags);
  }
  
+static inline bool
+reset_in_progress(const struct intel_engine_execlists *execlists)
+{
+       return unlikely(!__tasklet_is_enabled(&execlists->tasklet));
+}
+
  static void process_csb(struct intel_engine_cs *engine)
  {
         struct intel_engine_execlists * const execlists = &engine->execlists;
@@ -1109,18 +1107,9 @@ static void process_csb(struct intel_engine_cs *engine)
         execlists->csb_head = head;
  }
  
-/*
- * Check the unread Context Status Buffers and manage the submission of new
- * contexts to the ELSP accordingly.
- */
-static void execlists_submission_tasklet(unsigned long data)
+static void __execlists_submission_tasklet(struct intel_engine_cs *const engine)
  {
-       struct intel_engine_cs * const engine = (struct intel_engine_cs *)data;
-
-       GEM_TRACE("%s awake?=%d, active=%x\n",
-                 engine->name,
-                 engine->i915->gt.awake,
-                 engine->execlists.active);
+       lockdep_assert_held(&engine->timeline.lock);
  
         /*
          * We can skip acquiring intel_runtime_pm_get() here as it was taken
@@ -1137,6 +1126,28 @@ static void execlists_submission_tasklet(unsigned long data)
                 execlists_dequeue(engine);
  }
  
+/*
+ * Check the unread Context Status Buffers and manage the submission of new
+ * contexts to the ELSP accordingly.
+ */
+static void execlists_submission_tasklet(unsigned long data)
+{
+       struct intel_engine_cs * const engine = (struct intel_engine_cs *)data;
+       unsigned long flags;
+
+       GEM_TRACE("%s awake?=%d, active=%x\n",
+                 engine->name,
+                 engine->i915->gt.awake,
+                 engine->execlists.active);
+
+       spin_lock_irqsave(&engine->timeline.lock, flags);
+
+       if (engine->i915->gt.awake) /* we may be delayed until after we idle! */
+               __execlists_submission_tasklet(engine);
+
+       spin_unlock_irqrestore(&engine->timeline.lock, flags);
+}
+
  static void queue_request(struct intel_engine_cs *engine,
                           struct i915_sched_node *node,
                           int prio)
@@ -1145,16 +1156,30 @@ static void queue_request(struct intel_engine_cs *engine,
                       &lookup_priolist(engine, prio)->requests);
  }
  
-static void __submit_queue(struct intel_engine_cs *engine, int prio)
+static void __update_queue(struct intel_engine_cs *engine, int prio)
  {
         engine->execlists.queue_priority = prio;
-       tasklet_hi_schedule(&engine->execlists.tasklet);
+}
+
+static void __submit_queue_imm(struct intel_engine_cs *engine)
+{
+       struct intel_engine_execlists * const execlists = &engine->execlists;
+
+       if (reset_in_progress(execlists))
+               return; /* defer until we restart the engine following reset */
+
+       if (execlists->tasklet.func == execlists_submission_tasklet)
+               __execlists_submission_tasklet(engine);
+       else
+               tasklet_hi_schedule(&execlists->tasklet);
  }
  
  static void submit_queue(struct intel_engine_cs *engine, int prio)
  {
-       if (prio > engine->execlists.queue_priority)
-               __submit_queue(engine, prio);
+       if (prio > engine->execlists.queue_priority) {
+               __update_queue(engine, prio);
+               __submit_queue_imm(engine);
+       }
  }
  
  static void execlists_submit_request(struct i915_request *request)
@@ -1166,11 +1191,12 @@ static void execlists_submit_request(struct i915_request *request)
         spin_lock_irqsave(&engine->timeline.lock, flags);
  
         queue_request(engine, &request->sched, rq_prio(request));
-       submit_queue(engine, rq_prio(request));
  
         GEM_BUG_ON(!engine->execlists.first);
         GEM_BUG_ON(list_empty(&request->sched.link));
  
+       submit_queue(engine, rq_prio(request));
+
         spin_unlock_irqrestore(&engine->timeline.lock, flags);
  }
  
@@ -1297,8 +1323,11 @@ static void execlists_schedule(struct i915_request *request,
                 }
  
                 if (prio > engine->execlists.queue_priority &&
-                   i915_sw_fence_done(&sched_to_request(node)->submit))
-                       __submit_queue(engine, prio);
+                   i915_sw_fence_done(&sched_to_request(node)->submit)) {
+                       /* defer submission until after all of our updates */
+                       __update_queue(engine, prio);
+                       tasklet_hi_schedule(&engine->execlists.tasklet);
+               }
         }
  
         spin_unlock_irq(&engine->timeline.lock);
@@ -1879,6 +1908,7 @@ execlists_reset_prepare(struct intel_engine_cs *engine)
  {
         struct intel_engine_execlists * const execlists = &engine->execlists;
         struct i915_request *request, *active;
+       unsigned long flags;
  
         GEM_TRACE("%s\n", engine->name);
  
@@ -1893,6 +1923,8 @@ execlists_reset_prepare(struct intel_engine_cs *engine)
          */
         __tasklet_disable_sync_once(&execlists->tasklet);
  
+       spin_lock_irqsave(&engine->timeline.lock, flags);
+
         /*
          * We want to flush the pending context switches, having disabled
          * the tasklet above, we can assume exclusive access to the execlists.
@@ -1910,15 +1942,12 @@ execlists_reset_prepare(struct intel_engine_cs *engine)
         active = NULL;
         request = port_request(execlists->port);
         if (request) {
-               unsigned long flags;
-
                 /*
                  * Prevent the breadcrumb from advancing before we decide
                  * which request is currently active.
                  */
                 intel_engine_stop_cs(engine);
  
-               spin_lock_irqsave(&engine->timeline.lock, flags);
                 list_for_each_entry_from_reverse(request,
                                                  &engine->timeline.requests,
                                                  link) {
@@ -1928,9 +1957,10 @@ execlists_reset_prepare(struct intel_engine_cs *engine)
  
                         active = request;
                 }
-               spin_unlock_irqrestore(&engine->timeline.lock, flags);
         }
  
+       spin_unlock_irqrestore(&engine->timeline.lock, flags);
+
         return active;
  }
author	Chris Wilson <chris@chris-wilson.co.uk>
	Thu, 28 Jun 2018 20:12:11 +0000 (21:12 +0100)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Thu, 28 Jun 2018 21:55:10 +0000 (22:55 +0100)
drivers/gpu/drm/i915/i915_gem.h		patch \| blob \| history
drivers/gpu/drm/i915/intel_engine_cs.c		patch \| blob \| history
drivers/gpu/drm/i915/intel_lrc.c		patch \| blob \| history