drm/nouveau/ltc/gp10b: Add custom L2 cache implementation
authorThierry Reding <treding@nvidia.com>
Mon, 9 Dec 2019 12:00:04 +0000 (13:00 +0100)
committerBen Skeggs <bskeggs@redhat.com>
Wed, 15 Jan 2020 00:49:59 +0000 (10:49 +1000)
There are extra registers that need to be programmed to make the level 2
cache work on GP10B, such as the stream ID register that is used when an
SMMU is used to translate memory addresses.

Signed-off-by: Thierry Reding <treding@nvidia.com>
Signed-off-by: Ben Skeggs <bskeggs@redhat.com>
drivers/gpu/drm/nouveau/include/nvkm/subdev/ltc.h
drivers/gpu/drm/nouveau/nvkm/engine/device/base.c
drivers/gpu/drm/nouveau/nvkm/subdev/ltc/Kbuild
drivers/gpu/drm/nouveau/nvkm/subdev/ltc/gp10b.c [new file with mode: 0644]
drivers/gpu/drm/nouveau/nvkm/subdev/ltc/priv.h

index 644d527c3b969171e54a247a4442bff015ae23b6..d76f60d7d29a6924b32910211d02ca1c46b1c547 100644 (file)
@@ -40,4 +40,5 @@ int gm107_ltc_new(struct nvkm_device *, int, struct nvkm_ltc **);
 int gm200_ltc_new(struct nvkm_device *, int, struct nvkm_ltc **);
 int gp100_ltc_new(struct nvkm_device *, int, struct nvkm_ltc **);
 int gp102_ltc_new(struct nvkm_device *, int, struct nvkm_ltc **);
+int gp10b_ltc_new(struct nvkm_device *, int, struct nvkm_ltc **);
 #endif
index b061df1381429511527c4570f29df7027177e50b..231ec0073af3128c27c5b60609bab04761501d74 100644 (file)
@@ -2380,7 +2380,7 @@ nv13b_chipset = {
        .fuse = gm107_fuse_new,
        .ibus = gp10b_ibus_new,
        .imem = gk20a_instmem_new,
-       .ltc = gp102_ltc_new,
+       .ltc = gp10b_ltc_new,
        .mc = gp10b_mc_new,
        .mmu = gp10b_mmu_new,
        .secboot = gp10b_secboot_new,
index 2b6d36ea7067bc85a0c0cd1697dd3467060c0fb3..728d75010847a8a5f7e1eb0aedc362393ef93f94 100644 (file)
@@ -6,3 +6,4 @@ nvkm-y += nvkm/subdev/ltc/gm107.o
 nvkm-y += nvkm/subdev/ltc/gm200.o
 nvkm-y += nvkm/subdev/ltc/gp100.o
 nvkm-y += nvkm/subdev/ltc/gp102.o
+nvkm-y += nvkm/subdev/ltc/gp10b.o
diff --git a/drivers/gpu/drm/nouveau/nvkm/subdev/ltc/gp10b.c b/drivers/gpu/drm/nouveau/nvkm/subdev/ltc/gp10b.c
new file mode 100644 (file)
index 0000000..c0063c7
--- /dev/null
@@ -0,0 +1,65 @@
+/*
+ * Copyright (c) 2019 NVIDIA Corporation.
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE COPYRIGHT HOLDER(S) OR AUTHOR(S) BE LIABLE FOR ANY CLAIM, DAMAGES OR
+ * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
+ * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
+ * OTHER DEALINGS IN THE SOFTWARE.
+ *
+ * Authors: Thierry Reding
+ */
+
+#include "priv.h"
+
+static void
+gp10b_ltc_init(struct nvkm_ltc *ltc)
+{
+       struct nvkm_device *device = ltc->subdev.device;
+       struct iommu_fwspec *spec;
+
+       nvkm_wr32(device, 0x17e27c, ltc->ltc_nr);
+       nvkm_wr32(device, 0x17e000, ltc->ltc_nr);
+       nvkm_wr32(device, 0x100800, ltc->ltc_nr);
+
+       spec = dev_iommu_fwspec_get(device->dev);
+       if (spec) {
+               u32 sid = spec->ids[0] & 0xffff;
+
+               /* stream ID */
+               nvkm_wr32(device, 0x160000, sid << 2);
+       }
+}
+
+static const struct nvkm_ltc_func
+gp10b_ltc = {
+       .oneinit = gp100_ltc_oneinit,
+       .init = gp10b_ltc_init,
+       .intr = gp100_ltc_intr,
+       .cbc_clear = gm107_ltc_cbc_clear,
+       .cbc_wait = gm107_ltc_cbc_wait,
+       .zbc = 16,
+       .zbc_clear_color = gm107_ltc_zbc_clear_color,
+       .zbc_clear_depth = gm107_ltc_zbc_clear_depth,
+       .zbc_clear_stencil = gp102_ltc_zbc_clear_stencil,
+       .invalidate = gf100_ltc_invalidate,
+       .flush = gf100_ltc_flush,
+};
+
+int
+gp10b_ltc_new(struct nvkm_device *device, int index, struct nvkm_ltc **pltc)
+{
+       return nvkm_ltc_new_(&gp10b_ltc, device, index, pltc);
+}
index 2fcf18e46ce3d7a9418db3e114abcdc363f05bd4..eca5a711b1b83bb870561baa22f88c4e475c9212 100644 (file)
@@ -46,4 +46,6 @@ void gm107_ltc_zbc_clear_depth(struct nvkm_ltc *, int, const u32);
 int gp100_ltc_oneinit(struct nvkm_ltc *);
 void gp100_ltc_init(struct nvkm_ltc *);
 void gp100_ltc_intr(struct nvkm_ltc *);
+
+void gp102_ltc_zbc_clear_stencil(struct nvkm_ltc *, int, const u32);
 #endif