MIPS: Expand MIPS32 ASIDs to 64 bits
authorPaul Burton <paul.burton@mips.com>
Tue, 4 Dec 2018 23:44:12 +0000 (23:44 +0000)
committerPaul Burton <paul.burton@mips.com>
Wed, 5 Dec 2018 22:46:44 +0000 (14:46 -0800)
ASIDs have always been stored as unsigned longs, ie. 32 bits on MIPS32
kernels. This is problematic because it is feasible for the ASID version
to overflow & wrap around to zero.

We currently attempt to handle this overflow by simply setting the ASID
version to 1, using asid_first_version(), but we make no attempt to
account for the fact that there may be mm_structs with stale ASIDs that
have versions which we now reuse due to the overflow & wrap around.

Encountering this requires that:

  1) A struct mm_struct X is active on CPU A using ASID (V,n).

  2) That mm is not used on CPU A for the length of time that it takes
     for CPU A's asid_cache to overflow & wrap around to the same
     version V that the mm had in step 1. During this time tasks using
     the mm could either be sleeping or only scheduled on other CPUs.

  3) Some other mm Y becomes active on CPU A and is allocated the same
     ASID (V,n).

  4) mm X now becomes active on CPU A again, and now incorrectly has the
     same ASID as mm Y.

Where struct mm_struct ASIDs are represented above in the format
(version, EntryHi.ASID), and on a typical MIPS32 system version will be
24 bits wide & EntryHi.ASID will be 8 bits wide.

The length of time required in step 2 is highly dependent upon the CPU &
workload, but for a hypothetical 2GHz CPU running a workload which
generates a new ASID every 10000 cycles this period is around 248 days.
Due to this long period of time & the fact that tasks need to be
scheduled in just the right (or wrong, depending upon your inclination)
way, this is obviously a difficult bug to encounter but it's entirely
possible as evidenced by reports.

In order to fix this, simply extend ASIDs to 64 bits even on MIPS32
builds. This will extend the period of time required for the
hypothetical system above to encounter the problem from 28 days to
around 3 trillion years, which feels safely outside of the realms of
possibility.

The cost of this is slightly more generated code in some commonly
executed paths, but this is pretty minimal:

                         | Code Size Gain | Percentage
  -----------------------|----------------|-------------
    decstation_defconfig |           +270 | +0.00%
        32r2el_defconfig |           +652 | +0.01%
        32r6el_defconfig |          +1000 | +0.01%

I have been unable to measure any change in performance of the LMbench
lat_ctx or lat_proc tests resulting from the 64b ASIDs on either
32r2el_defconfig+interAptiv or 32r6el_defconfig+I6500 systems.

Signed-off-by: Paul Burton <paul.burton@mips.com>
Suggested-by: James Hogan <jhogan@kernel.org>
References: https://lore.kernel.org/linux-mips/80B78A8B8FEE6145A87579E8435D78C30205D5F3@fzex.ruijie.com.cn/
References: https://lore.kernel.org/linux-mips/1488684260-18867-1-git-send-email-jiwei.sun@windriver.com/
Cc: Jiwei Sun <jiwei.sun@windriver.com>
Cc: Yu Huabing <yhb@ruijie.com.cn>
Cc: stable@vger.kernel.org # 2.6.12+
Cc: linux-mips@vger.kernel.org
arch/mips/include/asm/cpu-info.h
arch/mips/include/asm/mmu.h
arch/mips/include/asm/mmu_context.h
arch/mips/mm/c-r3k.c

index a41059d47d31c52d377aa39694a0da3ba3e07af5..ed7ffe4e63a32edbe4c793936beed17626e7d305 100644 (file)
@@ -50,7 +50,7 @@ struct guest_info {
 #define MIPS_CACHE_PINDEX      0x00000020      /* Physically indexed cache */
 
 struct cpuinfo_mips {
-       unsigned long           asid_cache;
+       u64                     asid_cache;
 #ifdef CONFIG_MIPS_ASID_BITS_VARIABLE
        unsigned long           asid_mask;
 #endif
index 0740be7d5d4ac02a67206bf165825c497565910f..24d6b42345fb8ab800f2337447c897ecebfe4e2e 100644 (file)
@@ -7,7 +7,7 @@
 #include <linux/wait.h>
 
 typedef struct {
-       unsigned long asid[NR_CPUS];
+       u64 asid[NR_CPUS];
        void *vdso;
        atomic_t fp_mode_switching;
 
index 94414561de0e7b9c46d6d6af17c42de6e8519ab6..a589585be21be2111bc6e002f165884e3a42dfad 100644 (file)
@@ -76,14 +76,14 @@ extern unsigned long pgd_current[];
  *  All unused by hardware upper bits will be considered
  *  as a software asid extension.
  */
-static unsigned long asid_version_mask(unsigned int cpu)
+static inline u64 asid_version_mask(unsigned int cpu)
 {
        unsigned long asid_mask = cpu_asid_mask(&cpu_data[cpu]);
 
-       return ~(asid_mask | (asid_mask - 1));
+       return ~(u64)(asid_mask | (asid_mask - 1));
 }
 
-static unsigned long asid_first_version(unsigned int cpu)
+static inline u64 asid_first_version(unsigned int cpu)
 {
        return ~asid_version_mask(cpu) + 1;
 }
@@ -102,14 +102,12 @@ static inline void enter_lazy_tlb(struct mm_struct *mm, struct task_struct *tsk)
 static inline void
 get_new_mmu_context(struct mm_struct *mm, unsigned long cpu)
 {
-       unsigned long asid = asid_cache(cpu);
+       u64 asid = asid_cache(cpu);
 
        if (!((asid += cpu_asid_inc()) & cpu_asid_mask(&cpu_data[cpu]))) {
                if (cpu_has_vtag_icache)
                        flush_icache_all();
                local_flush_tlb_all();  /* start new asid cycle */
-               if (!asid)              /* fix version if needed */
-                       asid = asid_first_version(cpu);
        }
 
        cpu_context(cpu, mm) = asid_cache(cpu) = asid;
index 3466fcdae0ca294b2d2f43c1d4105693576aca3d..01848cdf207412f466630f11560dfaea45ca53b0 100644 (file)
@@ -245,7 +245,7 @@ static void r3k_flush_cache_page(struct vm_area_struct *vma,
        pmd_t *pmdp;
        pte_t *ptep;
 
-       pr_debug("cpage[%08lx,%08lx]\n",
+       pr_debug("cpage[%08llx,%08lx]\n",
                 cpu_context(smp_processor_id(), mm), addr);
 
        /* No ASID => no such page in the cache.  */