drm/scheduler: Fix bad job be re-processed in TDR

author Trigger Huang <Trigger.Huang@amd.com>

Wed, 14 Nov 2018 02:44:50 +0000 (10:44 +0800)

committer Alex Deucher <alexander.deucher@amd.com>

Mon, 19 Nov 2018 21:38:15 +0000 (16:38 -0500)
author Trigger Huang <Trigger.Huang@amd.com>
Wed, 14 Nov 2018 02:44:50 +0000 (10:44 +0800)
committer Alex Deucher <alexander.deucher@amd.com>
Mon, 19 Nov 2018 21:38:15 +0000 (16:38 -0500)
diff --git a/drivers/gpu/drm/scheduler/sched_main.c b/drivers/gpu/drm/scheduler/sched_main.c

index 18ebbb05762e99c0706aeba369c8d3d0baeafda7..6fedf9544bbf92aadadbeb9aaeeb6b1baeaf90c2 100644 (file)
--- a/drivers/gpu/drm/scheduler/sched_main.c
+++ b/drivers/gpu/drm/scheduler/sched_main.c
@@ -60,6 +60,8 @@
  
  static void drm_sched_process_job(struct dma_fence *f, struct dma_fence_cb *cb);
  
+static void drm_sched_expel_job_unlocked(struct drm_sched_job *s_job);
+
  /**
   * drm_sched_rq_init - initialize a given run queue struct
   *
@@ -228,7 +230,7 @@ static void drm_sched_job_finish(struct work_struct *work)
  
         spin_lock(&sched->job_list_lock);
         /* remove job from ring_mirror_list */
-       list_del(&s_job->node);
+       list_del_init(&s_job->node);
         /* queue TDR for next job */
         drm_sched_start_timeout(sched);
         spin_unlock(&sched->job_list_lock);
@@ -391,6 +393,8 @@ void drm_sched_job_recovery(struct drm_gpu_scheduler *sched)
                                           r);
                         dma_fence_put(fence);
                 } else {
+                       if (s_fence->finished.error < 0)
+                               drm_sched_expel_job_unlocked(s_job);
                         drm_sched_process_job(NULL, &s_fence->cb);
                 }
                 spin_lock(&sched->job_list_lock);
@@ -595,6 +599,8 @@ static int drm_sched_main(void *param)
                                           r);
                         dma_fence_put(fence);
                 } else {
+                       if (s_fence->finished.error < 0)
+                               drm_sched_expel_job_unlocked(sched_job);
                         drm_sched_process_job(NULL, &s_fence->cb);
                 }
  
@@ -603,6 +609,15 @@ static int drm_sched_main(void *param)
         return 0;
  }
  
+static void drm_sched_expel_job_unlocked(struct drm_sched_job *s_job)
+{
+       struct drm_gpu_scheduler *sched = s_job->sched;
+
+       spin_lock(&sched->job_list_lock);
+       list_del_init(&s_job->node);
+       spin_unlock(&sched->job_list_lock);
+}
+
  /**
   * drm_sched_init - Init a gpu scheduler instance
   *
author	Trigger Huang <Trigger.Huang@amd.com>
	Wed, 14 Nov 2018 02:44:50 +0000 (10:44 +0800)
committer	Alex Deucher <alexander.deucher@amd.com>
	Mon, 19 Nov 2018 21:38:15 +0000 (16:38 -0500)