drm/i915: Keep rings pinned while the context is active

author Chris Wilson <chris@chris-wilson.co.uk>

Wed, 19 Jun 2019 17:01:35 +0000 (18:01 +0100)

committer Chris Wilson <chris@chris-wilson.co.uk>

Wed, 19 Jun 2019 18:49:14 +0000 (19:49 +0100)
author Chris Wilson <chris@chris-wilson.co.uk>
Wed, 19 Jun 2019 17:01:35 +0000 (18:01 +0100)
committer Chris Wilson <chris@chris-wilson.co.uk>
Wed, 19 Jun 2019 18:49:14 +0000 (19:49 +0100)
diff --git a/drivers/gpu/drm/i915/gt/intel_context.c b/drivers/gpu/drm/i915/gt/intel_context.c

index 2c454f227c2e47cf94d05e8b2333e998fff5f6f0..23120901c55f410140f0b6029547de14014bb96e 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_context.c
+++ b/drivers/gpu/drm/i915/gt/intel_context.c
@@ -126,6 +126,7 @@ static void intel_context_retire(struct i915_active *active)
         if (ce->state)
                 __context_unpin_state(ce->state);
  
+       intel_ring_unpin(ce->ring);
         intel_context_put(ce);
  }
  
@@ -160,27 +161,35 @@ int intel_context_active_acquire(struct intel_context *ce, unsigned long flags)
  
         intel_context_get(ce);
  
+       err = intel_ring_pin(ce->ring);
+       if (err)
+               goto err_put;
+
         if (!ce->state)
                 return 0;
  
         err = __context_pin_state(ce->state, flags);
-       if (err) {
-               i915_active_cancel(&ce->active);
-               intel_context_put(ce);
-               return err;
-       }
+       if (err)
+               goto err_ring;
  
         /* Preallocate tracking nodes */
         if (!i915_gem_context_is_kernel(ce->gem_context)) {
                 err = i915_active_acquire_preallocate_barrier(&ce->active,
                                                               ce->engine);
-               if (err) {
-                       i915_active_release(&ce->active);
-                       return err;
-               }
+               if (err)
+                       goto err_state;
         }
  
         return 0;
+
+err_state:
+       __context_unpin_state(ce->state);
+err_ring:
+       intel_ring_unpin(ce->ring);
+err_put:
+       intel_context_put(ce);
+       i915_active_cancel(&ce->active);
+       return err;
  }
  
  void intel_context_active_release(struct intel_context *ce)
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_types.h b/drivers/gpu/drm/i915/gt/intel_engine_types.h

index 868b220214f81b23087d7d8641345fea137b6640..43e975a26016bf75038a044c55e222aefcf8ff2b 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_types.h
+++ b/drivers/gpu/drm/i915/gt/intel_engine_types.h
@@ -70,6 +70,18 @@ struct intel_ring {
         struct list_head request_list;
         struct list_head active_link;
  
+       /*
+        * As we have two types of rings, one global to the engine used
+        * by ringbuffer submission and those that are exclusive to a
+        * context used by execlists, we have to play safe and allow
+        * atomic updates to the pin_count. However, the actual pinning
+        * of the context is either done during initialisation for
+        * ringbuffer submission or serialised as part of the context
+        * pinning for execlists, and so we do not need a mutex ourselves
+        * to serialise intel_ring_pin/intel_ring_unpin.
+        */
+       atomic_t pin_count;
+
         u32 head;
         u32 tail;
         u32 emit;
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c

index b42b5f158295953b7b6da42f4846e96b9d4b4afb..82b7ace62d97ec13f110b4454115ae313d0791e0 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.c
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.c
@@ -1414,6 +1414,7 @@ static void execlists_context_destroy(struct kref *kref)
  {
         struct intel_context *ce = container_of(kref, typeof(*ce), ref);
  
+       GEM_BUG_ON(!i915_active_is_idle(&ce->active));
         GEM_BUG_ON(intel_context_is_pinned(ce));
  
         if (ce->state)
@@ -1426,7 +1427,6 @@ static void execlists_context_unpin(struct intel_context *ce)
  {
         i915_gem_context_unpin_hw_id(ce->gem_context);
         i915_gem_object_unpin_map(ce->state->obj);
-       intel_ring_unpin(ce->ring);
  }
  
  static void
@@ -1478,13 +1478,9 @@ __execlists_context_pin(struct intel_context *ce,
                 goto unpin_active;
         }
  
-       ret = intel_ring_pin(ce->ring);
-       if (ret)
-               goto unpin_map;
-
         ret = i915_gem_context_pin_hw_id(ce->gem_context);
         if (ret)
-               goto unpin_ring;
+               goto unpin_map;
  
         ce->lrc_desc = lrc_descriptor(ce, engine);
         ce->lrc_reg_state = vaddr + LRC_STATE_PN * PAGE_SIZE;
@@ -1492,8 +1488,6 @@ __execlists_context_pin(struct intel_context *ce,
  
         return 0;
  
-unpin_ring:
-       intel_ring_unpin(ce->ring);
  unpin_map:
         i915_gem_object_unpin_map(ce->state->obj);
  unpin_active:
diff --git a/drivers/gpu/drm/i915/gt/intel_ringbuffer.c b/drivers/gpu/drm/i915/gt/intel_ringbuffer.c

index c6023bc9452d0d90f8252d824d1492c07bc7022b..12010e79886888c5bbf2c0ae58a888f69e00dd6e 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_ringbuffer.c
+++ b/drivers/gpu/drm/i915/gt/intel_ringbuffer.c
@@ -1149,16 +1149,16 @@ i915_emit_bb_start(struct i915_request *rq,
  int intel_ring_pin(struct intel_ring *ring)
  {
         struct i915_vma *vma = ring->vma;
-       enum i915_map_type map = i915_coherent_map_type(vma->vm->i915);
         unsigned int flags;
         void *addr;
         int ret;
  
-       GEM_BUG_ON(ring->vaddr);
+       if (atomic_fetch_inc(&ring->pin_count))
+               return 0;
  
         ret = i915_timeline_pin(ring->timeline);
         if (ret)
-               return ret;
+               goto err_unpin;
  
         flags = PIN_GLOBAL;
  
@@ -1172,26 +1172,31 @@ int intel_ring_pin(struct intel_ring *ring)
  
         ret = i915_vma_pin(vma, 0, 0, flags);
         if (unlikely(ret))
-               goto unpin_timeline;
+               goto err_timeline;
  
         if (i915_vma_is_map_and_fenceable(vma))
                 addr = (void __force *)i915_vma_pin_iomap(vma);
         else
-               addr = i915_gem_object_pin_map(vma->obj, map);
+               addr = i915_gem_object_pin_map(vma->obj,
+                                              i915_coherent_map_type(vma->vm->i915));
         if (IS_ERR(addr)) {
                 ret = PTR_ERR(addr);
-               goto unpin_ring;
+               goto err_ring;
         }
  
         vma->obj->pin_global++;
  
+       GEM_BUG_ON(ring->vaddr);
         ring->vaddr = addr;
+
         return 0;
  
-unpin_ring:
+err_ring:
         i915_vma_unpin(vma);
-unpin_timeline:
+err_timeline:
         i915_timeline_unpin(ring->timeline);
+err_unpin:
+       atomic_dec(&ring->pin_count);
         return ret;
  }
  
@@ -1207,16 +1212,19 @@ void intel_ring_reset(struct intel_ring *ring, u32 tail)
  
  void intel_ring_unpin(struct intel_ring *ring)
  {
-       GEM_BUG_ON(!ring->vma);
-       GEM_BUG_ON(!ring->vaddr);
+       if (!atomic_dec_and_test(&ring->pin_count))
+               return;
  
         /* Discard any unused bytes beyond that submitted to hw. */
         intel_ring_reset(ring, ring->tail);
  
+       GEM_BUG_ON(!ring->vma);
         if (i915_vma_is_map_and_fenceable(ring->vma))
                 i915_vma_unpin_iomap(ring->vma);
         else
                 i915_gem_object_unpin_map(ring->vma->obj);
+
+       GEM_BUG_ON(!ring->vaddr);
         ring->vaddr = NULL;
  
         ring->vma->obj->pin_global--;
@@ -2081,10 +2089,11 @@ static void ring_destroy(struct intel_engine_cs *engine)
         WARN_ON(INTEL_GEN(dev_priv) > 2 &&
                 (ENGINE_READ(engine, RING_MI_MODE) & MODE_IDLE) == 0);
  
+       intel_engine_cleanup_common(engine);
+
         intel_ring_unpin(engine->buffer);
         intel_ring_put(engine->buffer);
  
-       intel_engine_cleanup_common(engine);
         kfree(engine);
  }
  
diff --git a/drivers/gpu/drm/i915/gt/mock_engine.c b/drivers/gpu/drm/i915/gt/mock_engine.c

index 086801b514416d0f175b1088ef87dde907a6708a..486c6953dcb182463ce7ceedcf2df716af8ca53f 100644 (file)
--- a/drivers/gpu/drm/i915/gt/mock_engine.c
+++ b/drivers/gpu/drm/i915/gt/mock_engine.c
@@ -66,6 +66,7 @@ static struct intel_ring *mock_ring(struct intel_engine_cs *engine)
         ring->base.effective_size = sz;
         ring->base.vaddr = (void *)(ring + 1);
         ring->base.timeline = &ring->timeline;
+       atomic_set(&ring->base.pin_count, 1);
  
         INIT_LIST_HEAD(&ring->base.request_list);
         intel_ring_update_space(&ring->base);
author	Chris Wilson <chris@chris-wilson.co.uk>
	Wed, 19 Jun 2019 17:01:35 +0000 (18:01 +0100)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Wed, 19 Jun 2019 18:49:14 +0000 (19:49 +0100)
drivers/gpu/drm/i915/gt/intel_context.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_types.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_ringbuffer.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/mock_engine.c		patch \| blob \| history