Merge tag 'pm-4.18-rc1' of git://git.kernel.org/pub/scm/linux/kernel/git/rafael/linux-pm
authorLinus Torvalds <torvalds@linux-foundation.org>
Tue, 5 Jun 2018 16:38:39 +0000 (09:38 -0700)
committerLinus Torvalds <torvalds@linux-foundation.org>
Tue, 5 Jun 2018 16:38:39 +0000 (09:38 -0700)
Pull power management updates from Rafael Wysocki:
 "These include a significant update of the generic power domains
  (genpd) and Operating Performance Points (OPP) frameworks, mostly
  related to the introduction of power domain performance levels,
  cpufreq updates (new driver for Qualcomm Kryo processors, updates of
  the existing drivers, some core fixes, schedutil governor
  improvements), PCI power management fixes, ACPI workaround for
  EC-based wakeup events handling on resume from suspend-to-idle, and
  major updates of the turbostat and pm-graph utilities.

  Specifics:

   - Introduce power domain performance levels into the the generic
     power domains (genpd) and Operating Performance Points (OPP)
     frameworks (Viresh Kumar, Rajendra Nayak, Dan Carpenter).

   - Fix two issues in the runtime PM framework related to the
     initialization and removal of devices using device links (Ulf
     Hansson).

   - Clean up the initialization of drivers for devices in PM domains
     (Ulf Hansson, Geert Uytterhoeven).

   - Fix a cpufreq core issue related to the policy sysfs interface
     causing CPU online to fail for CPUs sharing one cpufreq policy in
     some situations (Tao Wang).

   - Make it possible to use platform-specific suspend/resume hooks in
     the cpufreq-dt driver and make the Armada 37xx DVFS use that
     feature (Viresh Kumar, Miquel Raynal).

   - Optimize policy transition notifications in cpufreq (Viresh Kumar).

   - Improve the iowait boost mechanism in the schedutil cpufreq
     governor (Patrick Bellasi).

   - Improve the handling of deferred frequency updates in the schedutil
     cpufreq governor (Joel Fernandes, Dietmar Eggemann, Rafael Wysocki,
     Viresh Kumar).

   - Add a new cpufreq driver for Qualcomm Kryo (Ilia Lin).

   - Fix and clean up some cpufreq drivers (Colin Ian King, Dmitry
     Osipenko, Doug Smythies, Luc Van Oostenryck, Simon Horman, Viresh
     Kumar).

   - Fix the handling of PCI devices with the DPM_SMART_SUSPEND flag set
     and update stale comments in the PCI core PM code (Rafael Wysocki).

   - Work around an issue related to the handling of EC-based wakeup
     events in the ACPI PM core during resume from suspend-to-idle if
     the EC has been put into the low-power mode (Rafael Wysocki).

   - Improve the handling of wakeup source objects in the PM core (Doug
     Berger, Mahendran Ganesh, Rafael Wysocki).

   - Update the driver core to prevent deferred probe from breaking
     suspend/resume ordering (Feng Kan).

   - Clean up the PM core somewhat (Bjorn Helgaas, Ulf Hansson, Rafael
     Wysocki).

   - Make the core suspend/resume code and cpufreq support the RT patch
     (Sebastian Andrzej Siewior, Thomas Gleixner).

   - Consolidate the PM QoS handling in cpuidle governors (Rafael
     Wysocki).

   - Fix a possible crash in the hibernation core (Tetsuo Handa).

   - Update the rockchip-io Adaptive Voltage Scaling (AVS) driver (David
     Wu).

   - Update the turbostat utility (fixes, cleanups, new CPU IDs, new
     command line options, built-in "Low Power Idle" counters support,
     new POLL and POLL% columns) and add an entry for it to MAINTAINERS
     (Len Brown, Artem Bityutskiy, Chen Yu, Laura Abbott, Matt Turner,
     Prarit Bhargava, Srinivas Pandruvada).

   - Update the pm-graph to version 5.1 (Todd Brandt).

   - Update the intel_pstate_tracer utility (Doug Smythies)"

* tag 'pm-4.18-rc1' of git://git.kernel.org/pub/scm/linux/kernel/git/rafael/linux-pm: (128 commits)
  tools/power turbostat: update version number
  tools/power turbostat: Add Node in output
  tools/power turbostat: add node information into turbostat calculations
  tools/power turbostat: remove num_ from cpu_topology struct
  tools/power turbostat: rename num_cores_per_pkg to num_cores_per_node
  tools/power turbostat: track thread ID in cpu_topology
  tools/power turbostat: Calculate additional node information for a package
  tools/power turbostat: Fix node and siblings lookup data
  tools/power turbostat: set max_num_cpus equal to the cpumask length
  tools/power turbostat: if --num_iterations, print for specific number of iterations
  tools/power turbostat: Add Cannon Lake support
  tools/power turbostat: delete duplicate #defines
  x86: msr-index.h: Correct SNB_C1/C3_AUTO_UNDEMOTE defines
  tools/power turbostat: Correct SNB_C1/C3_AUTO_UNDEMOTE defines
  tools/power turbostat: add POLL and POLL% column
  tools/power turbostat: Fix --hide Pk%pc10
  tools/power turbostat: Build-in "Low Power Idle" counters support
  tools/power turbostat: Don't make man pages executable
  tools/power turbostat: remove blank lines
  tools/power turbostat: a small C-states dump readability immprovement
  ...

1  2 
MAINTAINERS
drivers/amba/bus.c
drivers/base/platform.c
drivers/pci/pci-driver.c
drivers/spi/spi.c
kernel/sched/cpufreq_schedutil.c
kernel/time/tick-common.c

diff --cc MAINTAINERS
Simple merge
Simple merge
Simple merge
Simple merge
Simple merge
index 28592b62b1d5cb95570b492fe6e25156ba4d6d0b,fd76497efeb17619357e0acbe6ba0f5aed4989ac..3cde46483f0aa5e57ea14502322fd90741e88ac0
@@@ -197,37 -206,101 +205,101 @@@ static unsigned long sugov_aggregate_ut
         * util_cfs + util_dl as requested freq. However, cpufreq is not yet
         * ready for such an interface. So, we only do the latter for now.
         */
 -      return min(util, sg_cpu->max);
 +      return min(sg_cpu->max, (sg_cpu->util_dl + sg_cpu->util_cfs));
  }
  
- static void sugov_set_iowait_boost(struct sugov_cpu *sg_cpu, u64 time, unsigned int flags)
+ /**
+  * sugov_iowait_reset() - Reset the IO boost status of a CPU.
+  * @sg_cpu: the sugov data for the CPU to boost
+  * @time: the update time from the caller
+  * @set_iowait_boost: true if an IO boost has been requested
+  *
+  * The IO wait boost of a task is disabled after a tick since the last update
+  * of a CPU. If a new IO wait boost is requested after more then a tick, then
+  * we enable the boost starting from the minimum frequency, which improves
+  * energy efficiency by ignoring sporadic wakeups from IO.
+  */
+ static bool sugov_iowait_reset(struct sugov_cpu *sg_cpu, u64 time,
+                              bool set_iowait_boost)
  {
-       if (flags & SCHED_CPUFREQ_IOWAIT) {
-               if (sg_cpu->iowait_boost_pending)
-                       return;
+       s64 delta_ns = time - sg_cpu->last_update;
  
-               sg_cpu->iowait_boost_pending = true;
+       /* Reset boost only if a tick has elapsed since last request */
+       if (delta_ns <= TICK_NSEC)
+               return false;
  
-               if (sg_cpu->iowait_boost) {
-                       sg_cpu->iowait_boost <<= 1;
-                       if (sg_cpu->iowait_boost > sg_cpu->iowait_boost_max)
-                               sg_cpu->iowait_boost = sg_cpu->iowait_boost_max;
-               } else {
-                       sg_cpu->iowait_boost = sg_cpu->sg_policy->policy->min;
-               }
-       } else if (sg_cpu->iowait_boost) {
-               s64 delta_ns = time - sg_cpu->last_update;
+       sg_cpu->iowait_boost = set_iowait_boost
+               ? sg_cpu->sg_policy->policy->min : 0;
+       sg_cpu->iowait_boost_pending = set_iowait_boost;
  
-               /* Clear iowait_boost if the CPU apprears to have been idle. */
-               if (delta_ns > TICK_NSEC) {
-                       sg_cpu->iowait_boost = 0;
-                       sg_cpu->iowait_boost_pending = false;
-               }
+       return true;
+ }
+ /**
+  * sugov_iowait_boost() - Updates the IO boost status of a CPU.
+  * @sg_cpu: the sugov data for the CPU to boost
+  * @time: the update time from the caller
+  * @flags: SCHED_CPUFREQ_IOWAIT if the task is waking up after an IO wait
+  *
+  * Each time a task wakes up after an IO operation, the CPU utilization can be
+  * boosted to a certain utilization which doubles at each "frequent and
+  * successive" wakeup from IO, ranging from the utilization of the minimum
+  * OPP to the utilization of the maximum OPP.
+  * To keep doubling, an IO boost has to be requested at least once per tick,
+  * otherwise we restart from the utilization of the minimum OPP.
+  */
+ static void sugov_iowait_boost(struct sugov_cpu *sg_cpu, u64 time,
+                              unsigned int flags)
+ {
+       bool set_iowait_boost = flags & SCHED_CPUFREQ_IOWAIT;
+       /* Reset boost if the CPU appears to have been idle enough */
+       if (sg_cpu->iowait_boost &&
+           sugov_iowait_reset(sg_cpu, time, set_iowait_boost))
+               return;
+       /* Boost only tasks waking up after IO */
+       if (!set_iowait_boost)
+               return;
+       /* Ensure boost doubles only one time at each request */
+       if (sg_cpu->iowait_boost_pending)
+               return;
+       sg_cpu->iowait_boost_pending = true;
+       /* Double the boost at each request */
+       if (sg_cpu->iowait_boost) {
+               sg_cpu->iowait_boost <<= 1;
+               if (sg_cpu->iowait_boost > sg_cpu->iowait_boost_max)
+                       sg_cpu->iowait_boost = sg_cpu->iowait_boost_max;
+               return;
        }
+       /* First wakeup after IO: start with minimum boost */
+       sg_cpu->iowait_boost = sg_cpu->sg_policy->policy->min;
  }
  
- static void sugov_iowait_boost(struct sugov_cpu *sg_cpu, unsigned long *util,
-                              unsigned long *max)
+ /**
+  * sugov_iowait_apply() - Apply the IO boost to a CPU.
+  * @sg_cpu: the sugov data for the cpu to boost
+  * @time: the update time from the caller
+  * @util: the utilization to (eventually) boost
+  * @max: the maximum value the utilization can be boosted to
+  *
+  * A CPU running a task which woken up after an IO operation can have its
+  * utilization boosted to speed up the completion of those IO operations.
+  * The IO boost value is increased each time a task wakes up from IO, in
+  * sugov_iowait_apply(), and it's instead decreased by this function,
+  * each time an increase has not been requested (!iowait_boost_pending).
+  *
+  * A CPU which also appears to have been idle for at least one tick has also
+  * its IO boost utilization reset.
+  *
+  * This mechanism is designed to boost high frequently IO waiting tasks, while
+  * being more conservative on tasks which does sporadic IO operations.
+  */
+ static void sugov_iowait_apply(struct sugov_cpu *sg_cpu, u64 time,
+                              unsigned long *util, unsigned long *max)
  {
        unsigned int boost_util, boost_max;
  
Simple merge