linux-kernel - Re: [PATCH v2 11/34] drm/msm: drm

lists.openwall.net		lists / announce owl-users owl-dev john-users john-dev passwdqc-users yescrypt popa3d-users / oss-security kernel-hardening musl sabotage tlsify passwords / crypt-dev xvendor / Bugtraq Full-Disclosure linux-kernel linux-netdev linux-ext4 linux-hardening linux-cve-announce PHC
Open Source and information security mailing list archives
Hash Suite: Windows password security audit tool. GUI, reports in PDF.
[<prev] [next>] [<thread-prev] [thread-next>] [day] [month] [year] [list]
Message-ID: <ddf4c580-883c-4a0b-b760-2c2f7b750383@quicinc.com>
Date: Wed, 16 Apr 2025 22:50:06 +0530
From: Akhil P Oommen <quic_akhilpo@...cinc.com>
To: Rob Clark <robdclark@...il.com>, <dri-devel@...ts.freedesktop.org>
CC: <freedreno@...ts.freedesktop.org>, <linux-arm-msm@...r.kernel.org>,
        "Rob
 Clark" <robdclark@...omium.org>,
        Abhinav Kumar <quic_abhinavk@...cinc.com>,
        Dmitry Baryshkov <lumag@...nel.org>, Sean Paul <sean@...rly.run>,
        "Marijn
 Suijten" <marijn.suijten@...ainline.org>,
        David Airlie <airlied@...il.com>, Simona Vetter <simona@...ll.ch>,
        Konrad Dybcio <konradybcio@...nel.org>,
        "open list" <linux-kernel@...r.kernel.org>
Subject: Re: [PATCH v2 11/34] drm/msm: drm_gpuvm conversion

On 3/19/2025 8:22 PM, Rob Clark wrote:
> From: Rob Clark <robdclark@...omium.org>
> 
> Now that we've realigned deletion and allocation, switch over to using
> drm_gpuvm/drm_gpuva.  This allows us to support multiple VMAs per BO per
> VM, to allow mapping different parts of a single BO at different virtual
> addresses, which is a key requirement for sparse/VM_BIND.
> 
> This prepares us for using drm_gpuvm to translate a batch of MAP/
> MAP_NULL/UNMAP operations from userspace into a sequence of map/remap/
> unmap steps for updating the page tables.
> 
> Signed-off-by: Rob Clark <robdclark@...omium.org>
> ---
>  drivers/gpu/drm/msm/Kconfig              |   1 +
>  drivers/gpu/drm/msm/adreno/a2xx_gpu.c    |   3 +-
>  drivers/gpu/drm/msm/adreno/a6xx_gmu.c    |   6 +-
>  drivers/gpu/drm/msm/adreno/a6xx_gpu.c    |   5 +-
>  drivers/gpu/drm/msm/adreno/adreno_gpu.c  |   7 +-
>  drivers/gpu/drm/msm/disp/mdp4/mdp4_kms.c |   5 +-
>  drivers/gpu/drm/msm/msm_drv.c            |   1 +
>  drivers/gpu/drm/msm/msm_gem.c            | 142 ++++++++++++++---------
>  drivers/gpu/drm/msm/msm_gem.h            |  87 +++++++++++---
>  drivers/gpu/drm/msm/msm_gem_submit.c     |   2 +-
>  drivers/gpu/drm/msm/msm_gem_vma.c        | 139 +++++++++++++++-------
>  drivers/gpu/drm/msm/msm_kms.c            |   4 +-
>  12 files changed, 268 insertions(+), 134 deletions(-)
> 
> diff --git a/drivers/gpu/drm/msm/Kconfig b/drivers/gpu/drm/msm/Kconfig
> index 974bc7c0ea76..4af7e896c1d4 100644
> --- a/drivers/gpu/drm/msm/Kconfig
> +++ b/drivers/gpu/drm/msm/Kconfig
> @@ -21,6 +21,7 @@ config DRM_MSM
>  	select DRM_DISPLAY_HELPER
>  	select DRM_BRIDGE_CONNECTOR
>  	select DRM_EXEC
> +	select DRM_GPUVM
>  	select DRM_KMS_HELPER
>  	select DRM_PANEL
>  	select DRM_BRIDGE
> diff --git a/drivers/gpu/drm/msm/adreno/a2xx_gpu.c b/drivers/gpu/drm/msm/adreno/a2xx_gpu.c
> index db1aa281ce47..94c49ed057cd 100644
> --- a/drivers/gpu/drm/msm/adreno/a2xx_gpu.c
> +++ b/drivers/gpu/drm/msm/adreno/a2xx_gpu.c
> @@ -472,8 +472,7 @@ a2xx_create_vm(struct msm_gpu *gpu, struct platform_device *pdev)
>  	struct msm_mmu *mmu = a2xx_gpummu_new(&pdev->dev, gpu);
>  	struct msm_gem_vm *vm;
>  
> -	vm = msm_gem_vm_create(mmu, "gpu", SZ_16M,
> -		0xfff * SZ_64K);
> +	vm = msm_gem_vm_create(gpu->dev, mmu, "gpu", SZ_16M, 0xfff * SZ_64K, true);
>  
>  	if (IS_ERR(vm) && !IS_ERR(mmu))
>  		mmu->funcs->destroy(mmu);
> diff --git a/drivers/gpu/drm/msm/adreno/a6xx_gmu.c b/drivers/gpu/drm/msm/adreno/a6xx_gmu.c
> index 4c459ae25cba..259a589a827d 100644
> --- a/drivers/gpu/drm/msm/adreno/a6xx_gmu.c
> +++ b/drivers/gpu/drm/msm/adreno/a6xx_gmu.c
> @@ -1311,7 +1311,7 @@ static int a6xx_gmu_memory_alloc(struct a6xx_gmu *gmu, struct a6xx_gmu_bo *bo,
>  	return 0;
>  }
>  
> -static int a6xx_gmu_memory_probe(struct a6xx_gmu *gmu)
> +static int a6xx_gmu_memory_probe(struct drm_device *drm, struct a6xx_gmu *gmu)
>  {
>  	struct msm_mmu *mmu;
>  
> @@ -1321,7 +1321,7 @@ static int a6xx_gmu_memory_probe(struct a6xx_gmu *gmu)
>  	if (IS_ERR(mmu))
>  		return PTR_ERR(mmu);
>  
> -	gmu->vm = msm_gem_vm_create(mmu, "gmu", 0x0, 0x80000000);
> +	gmu->vm = msm_gem_vm_create(drm, mmu, "gmu", 0x0, 0x80000000, true);
>  	if (IS_ERR(gmu->vm))
>  		return PTR_ERR(gmu->vm);
>  
> @@ -1940,7 +1940,7 @@ int a6xx_gmu_init(struct a6xx_gpu *a6xx_gpu, struct device_node *node)
>  	if (ret)
>  		goto err_put_device;
>  
> -	ret = a6xx_gmu_memory_probe(gmu);
> +	ret = a6xx_gmu_memory_probe(adreno_gpu->base.dev, gmu);
>  	if (ret)
>  		goto err_put_device;
>  
> diff --git a/drivers/gpu/drm/msm/adreno/a6xx_gpu.c b/drivers/gpu/drm/msm/adreno/a6xx_gpu.c
> index fa63149bf73f..a124249f7a1d 100644
> --- a/drivers/gpu/drm/msm/adreno/a6xx_gpu.c
> +++ b/drivers/gpu/drm/msm/adreno/a6xx_gpu.c
> @@ -2271,9 +2271,8 @@ a6xx_create_private_vm(struct msm_gpu *gpu)
>  	if (IS_ERR(mmu))
>  		return ERR_CAST(mmu);
>  
> -	return msm_gem_vm_create(mmu,
> -		"gpu", 0x100000000ULL,
> -		adreno_private_vm_size(gpu));
> +	return msm_gem_vm_create(gpu->dev, mmu, "gpu", 0x100000000ULL,
> +				 adreno_private_vm_size(gpu), true);
>  }
>  
>  static uint32_t a6xx_get_rptr(struct msm_gpu *gpu, struct msm_ringbuffer *ring)
> diff --git a/drivers/gpu/drm/msm/adreno/adreno_gpu.c b/drivers/gpu/drm/msm/adreno/adreno_gpu.c
> index ffbbf3d5ce2f..0ba1819833ab 100644
> --- a/drivers/gpu/drm/msm/adreno/adreno_gpu.c
> +++ b/drivers/gpu/drm/msm/adreno/adreno_gpu.c
> @@ -224,7 +224,8 @@ adreno_iommu_create_vm(struct msm_gpu *gpu,
>  	start = max_t(u64, SZ_16M, geometry->aperture_start);
>  	size = geometry->aperture_end - start + 1;
>  
> -	vm = msm_gem_vm_create(mmu, "gpu", start & GENMASK_ULL(48, 0), size);
> +	vm = msm_gem_vm_create(gpu->dev, mmu, "gpu", start & GENMASK_ULL(48, 0),
> +			       size, true);
>  
>  	if (IS_ERR(vm) && !IS_ERR(mmu))
>  		mmu->funcs->destroy(mmu);
> @@ -403,12 +404,12 @@ int adreno_get_param(struct msm_gpu *gpu, struct msm_context *ctx,
>  	case MSM_PARAM_VA_START:
>  		if (ctx->vm == gpu->vm)
>  			return UERR(EINVAL, drm, "requires per-process pgtables");
> -		*value = ctx->vm->va_start;
> +		*value = ctx->vm->base.mm_start;
>  		return 0;
>  	case MSM_PARAM_VA_SIZE:
>  		if (ctx->vm == gpu->vm)
>  			return UERR(EINVAL, drm, "requires per-process pgtables");
> -		*value = ctx->vm->va_size;
> +		*value = ctx->vm->base.mm_range;
>  		return 0;
>  	case MSM_PARAM_HIGHEST_BANK_BIT:
>  		*value = adreno_gpu->ubwc_config.highest_bank_bit;
> diff --git a/drivers/gpu/drm/msm/disp/mdp4/mdp4_kms.c b/drivers/gpu/drm/msm/disp/mdp4/mdp4_kms.c
> index 94fbc20b2fbd..d5b5628bee24 100644
> --- a/drivers/gpu/drm/msm/disp/mdp4/mdp4_kms.c
> +++ b/drivers/gpu/drm/msm/disp/mdp4/mdp4_kms.c
> @@ -451,8 +451,9 @@ static int mdp4_kms_init(struct drm_device *dev)
>  				"contig buffers for scanout\n");
>  		vm = NULL;
>  	} else {
> -		vm  = msm_gem_vm_create(mmu,
> -			"mdp4", 0x1000, 0x100000000 - 0x1000);
> +		vm  = msm_gem_vm_create(dev, mmu, "mdp4",
> +					0x1000, 0x100000000 - 0x1000,
> +					true);
>  
>  		if (IS_ERR(vm)) {
>  			if (!IS_ERR(mmu))
> diff --git a/drivers/gpu/drm/msm/msm_drv.c b/drivers/gpu/drm/msm/msm_drv.c
> index 978f1d355b42..6ef29bc48bb0 100644
> --- a/drivers/gpu/drm/msm/msm_drv.c
> +++ b/drivers/gpu/drm/msm/msm_drv.c
> @@ -776,6 +776,7 @@ static const struct file_operations fops = {
>  
>  static const struct drm_driver msm_driver = {
>  	.driver_features    = DRIVER_GEM |
> +				DRIVER_GEM_GPUVA |
>  				DRIVER_RENDER |
>  				DRIVER_ATOMIC |
>  				DRIVER_MODESET |
> diff --git a/drivers/gpu/drm/msm/msm_gem.c b/drivers/gpu/drm/msm/msm_gem.c
> index 4c10eca404e0..7901871c66cc 100644
> --- a/drivers/gpu/drm/msm/msm_gem.c
> +++ b/drivers/gpu/drm/msm/msm_gem.c
> @@ -47,9 +47,32 @@ static int msm_gem_open(struct drm_gem_object *obj, struct drm_file *file)
>  	return 0;
>  }
>  
> +static void put_iova_spaces(struct drm_gem_object *obj, struct drm_gpuvm *vm, bool close);
> +
>  static void msm_gem_close(struct drm_gem_object *obj, struct drm_file *file)
>  {
> +	struct msm_context *ctx = file->driver_priv;
> +
>  	update_ctx_mem(file, -obj->size);
> +
> +	/*
> +	 * If VM isn't created yet, nothing to cleanup.  And in fact calling
> +	 * put_iova_spaces() with vm=NULL would be bad, in that it will tear-
> +	 * down the mappings of shared buffers in other contexts.
> +	 */
> +	if (!ctx->vm)
> +		return;
> +
> +	/*
> +	 * TODO we might need to kick this to a queue to avoid blocking
> +	 * in CLOSE ioctl
> +	 */
> +	dma_resv_wait_timeout(obj->resv, DMA_RESV_USAGE_READ, false,
> +			      msecs_to_jiffies(1000));
> +
> +	msm_gem_lock(obj);
> +	put_iova_spaces(obj, &ctx->vm->base, true);
> +	msm_gem_unlock(obj);
>  }
>  
>  /*
> @@ -171,6 +194,13 @@ static void put_pages(struct drm_gem_object *obj)
>  {
>  	struct msm_gem_object *msm_obj = to_msm_bo(obj);
>  
> +	/*
> +	 * Skip gpuvm in the object free path to avoid a WARN_ON() splat.
> +	 * See explaination in msm_gem_assert_locked()
> +	 */
> +	if (kref_read(&obj->refcount))
> +		drm_gpuvm_bo_gem_evict(obj, true);
> +
>  	if (msm_obj->pages) {
>  		if (msm_obj->sgt) {
>  			/* For non-cached buffers, ensure the new
> @@ -338,16 +368,25 @@ uint64_t msm_gem_mmap_offset(struct drm_gem_object *obj)
>  }
>  
>  static struct msm_gem_vma *lookup_vma(struct drm_gem_object *obj,
> -		struct msm_gem_vm *vm)
> +				      struct msm_gem_vm *vm)
>  {
> -	struct msm_gem_object *msm_obj = to_msm_bo(obj);
> -	struct msm_gem_vma *vma;
> +	struct drm_gpuvm_bo *vm_bo;
>  
>  	msm_gem_assert_locked(obj);
>  
> -	list_for_each_entry(vma, &msm_obj->vmas, list) {
> -		if (vma->vm == vm)
> -			return vma;
> +	drm_gem_for_each_gpuvm_bo (vm_bo, obj) {
> +		struct drm_gpuva *vma;
> +
> +		drm_gpuvm_bo_for_each_va (vma, vm_bo) {
> +			if (vma->vm == &vm->base) {
> +				/* lookup_vma() should only be used in paths
> +				 * with at most one vma per vm
> +				 */
> +				GEM_WARN_ON(!list_is_singular(&vm_bo->list.gpuva));
> +
> +				return to_msm_vma(vma);
> +			}
> +		}
>  	}
>  
>  	return NULL;
> @@ -360,33 +399,29 @@ static struct msm_gem_vma *lookup_vma(struct drm_gem_object *obj,
>   * mapping.
>   */
>  static void
> -put_iova_spaces(struct drm_gem_object *obj, bool close)
> +put_iova_spaces(struct drm_gem_object *obj, struct drm_gpuvm *vm, bool close)
>  {
> -	struct msm_gem_object *msm_obj = to_msm_bo(obj);
> -	struct msm_gem_vma *vma, *tmp;
> +	struct drm_gpuvm_bo *vm_bo, *tmp;
>  
>  	msm_gem_assert_locked(obj);
>  
> -	list_for_each_entry_safe(vma, tmp, &msm_obj->vmas, list) {
> -		if (vma->vm) {
> -			msm_gem_vma_purge(vma);
> -			if (close)
> -				msm_gem_vma_close(vma);
> -		}
> -	}
> -}
> +	drm_gem_for_each_gpuvm_bo_safe (vm_bo, tmp, obj) {
> +		struct drm_gpuva *vma, *vmatmp;
>  
> -/* Called with msm_obj locked */
> -static void
> -put_iova_vmas(struct drm_gem_object *obj)
> -{
> -	struct msm_gem_object *msm_obj = to_msm_bo(obj);
> -	struct msm_gem_vma *vma, *tmp;
> +		if (vm && vm_bo->vm != vm)
> +			continue;
>  
> -	msm_gem_assert_locked(obj);
> +		drm_gpuvm_bo_get(vm_bo);
>  
> -	list_for_each_entry_safe(vma, tmp, &msm_obj->vmas, list) {
> -		msm_gem_vma_close(vma);
> +		drm_gpuvm_bo_for_each_va_safe (vma, vmatmp, vm_bo) {
> +			struct msm_gem_vma *msm_vma = to_msm_vma(vma);
> +
> +			msm_gem_vma_purge(msm_vma);
> +			if (close)
> +				msm_gem_vma_close(msm_vma);
> +		}
> +
> +		drm_gpuvm_bo_put(vm_bo);
>  	}
>  }
>  
> @@ -394,7 +429,6 @@ static struct msm_gem_vma *get_vma_locked(struct drm_gem_object *obj,
>  		struct msm_gem_vm *vm,
>  		u64 range_start, u64 range_end)
>  {
> -	struct msm_gem_object *msm_obj = to_msm_bo(obj);
>  	struct msm_gem_vma *vma;
>  
>  	msm_gem_assert_locked(obj);
> @@ -403,12 +437,9 @@ static struct msm_gem_vma *get_vma_locked(struct drm_gem_object *obj,
>  
>  	if (!vma) {
>  		vma = msm_gem_vma_new(vm, obj, range_start, range_end);
> -		if (IS_ERR(vma))
> -			return vma;
> -		list_add_tail(&vma->list, &msm_obj->vmas);
>  	} else {
> -		GEM_WARN_ON(vma->iova < range_start);
> -		GEM_WARN_ON((vma->iova + obj->size) > range_end);
> +		GEM_WARN_ON(vma->base.va.addr < range_start);
> +		GEM_WARN_ON((vma->base.va.addr + obj->size) > range_end);
>  	}
>  
>  	return vma;
> @@ -492,7 +523,7 @@ static int get_and_pin_iova_range_locked(struct drm_gem_object *obj,
>  
>  	ret = msm_gem_pin_vma_locked(obj, vma);
>  	if (!ret) {
> -		*iova = vma->iova;
> +		*iova = vma->base.va.addr;
>  		pin_obj_locked(obj);
>  	}
>  
> @@ -538,7 +569,7 @@ int msm_gem_get_iova(struct drm_gem_object *obj,
>  	if (IS_ERR(vma)) {
>  		ret = PTR_ERR(vma);
>  	} else {
> -		*iova = vma->iova;
> +		*iova = vma->base.va.addr;
>  	}
>  	msm_gem_unlock(obj);
>  
> @@ -579,7 +610,7 @@ int msm_gem_set_iova(struct drm_gem_object *obj,
>  		vma = get_vma_locked(obj, vm, iova, iova + obj->size);
>  		if (IS_ERR(vma)) {
>  			ret = PTR_ERR(vma);
> -		} else if (GEM_WARN_ON(vma->iova != iova)) {
> +		} else if (GEM_WARN_ON(vma->base.va.addr != iova)) {
>  			clear_iova(obj, vm);
>  			ret = -EBUSY;
>  		}
> @@ -763,7 +794,7 @@ void msm_gem_purge(struct drm_gem_object *obj)
>  	GEM_WARN_ON(!is_purgeable(msm_obj));
>  
>  	/* Get rid of any iommu mapping(s): */
> -	put_iova_spaces(obj, true);
> +	put_iova_spaces(obj, NULL, true);
>  
>  	msm_gem_vunmap(obj);
>  
> @@ -771,8 +802,6 @@ void msm_gem_purge(struct drm_gem_object *obj)
>  
>  	put_pages(obj);
>  
> -	put_iova_vmas(obj);
> -
>  	mutex_lock(&priv->lru.lock);
>  	/* A one-way transition: */
>  	msm_obj->madv = __MSM_MADV_PURGED;
> @@ -803,7 +832,7 @@ void msm_gem_evict(struct drm_gem_object *obj)
>  	GEM_WARN_ON(is_unevictable(msm_obj));
>  
>  	/* Get rid of any iommu mapping(s): */
> -	put_iova_spaces(obj, false);
> +	put_iova_spaces(obj, NULL, false);
>  
>  	drm_vma_node_unmap(&obj->vma_node, dev->anon_inode->i_mapping);
>  
> @@ -869,7 +898,6 @@ void msm_gem_describe(struct drm_gem_object *obj, struct seq_file *m,
>  {
>  	struct msm_gem_object *msm_obj = to_msm_bo(obj);
>  	struct dma_resv *robj = obj->resv;
> -	struct msm_gem_vma *vma;
>  	uint64_t off = drm_vma_node_start(&obj->vma_node);
>  	const char *madv;
>  
> @@ -912,14 +940,17 @@ void msm_gem_describe(struct drm_gem_object *obj, struct seq_file *m,
>  
>  	seq_printf(m, " %08zu %9s %-32s\n", obj->size, madv, msm_obj->name);
>  
> -	if (!list_empty(&msm_obj->vmas)) {
> +	if (!list_empty(&obj->gpuva.list)) {
> +		struct drm_gpuvm_bo *vm_bo;
>  
>  		seq_puts(m, "      vmas:");
>  
> -		list_for_each_entry(vma, &msm_obj->vmas, list) {
> -			const char *name, *comm;
> -			if (vma->vm) {
> -				struct msm_gem_vm *vm = vma->vm;
> +		drm_gem_for_each_gpuvm_bo (vm_bo, obj) {
> +			struct drm_gpuva *vma;
> +
> +			drm_gpuvm_bo_for_each_va (vma, vm_bo) {
> +				const char *name, *comm;
> +				struct msm_gem_vm *vm = to_msm_vm(vma->vm);
>  				struct task_struct *task =
>  					get_pid_task(vm->pid, PIDTYPE_PID);
>  				if (task) {
> @@ -928,15 +959,14 @@ void msm_gem_describe(struct drm_gem_object *obj, struct seq_file *m,
>  				} else {
>  					comm = NULL;
>  				}
> -				name = vm->name;
> -			} else {
> -				name = comm = NULL;
> +				name = vm->base.name;
> +
> +				seq_printf(m, " [%s%s%s: vm=%p, %08llx,%smapped]",
> +					   name, comm ? ":" : "", comm ? comm : "",
> +					   vma->vm, vma->va.addr,
> +					   to_msm_vma(vma)->mapped ? "" : "un");
> +				kfree(comm);
>  			}
> -			seq_printf(m, " [%s%s%s: vm=%p, %08llx,%s]",
> -				name, comm ? ":" : "", comm ? comm : "",
> -				vma->vm, vma->iova,
> -				vma->mapped ? "mapped" : "unmapped");
> -			kfree(comm);
>  		}
>  
>  		seq_puts(m, "\n");
> @@ -982,7 +1012,7 @@ static void msm_gem_free_object(struct drm_gem_object *obj)
>  	list_del(&msm_obj->node);
>  	mutex_unlock(&priv->obj_lock);
>  
> -	put_iova_spaces(obj, true);
> +	put_iova_spaces(obj, NULL, true);
>  
>  	if (obj->import_attach) {
>  		GEM_WARN_ON(msm_obj->vaddr);
> @@ -992,13 +1022,10 @@ static void msm_gem_free_object(struct drm_gem_object *obj)
>  		 */
>  		kvfree(msm_obj->pages);
>  
> -		put_iova_vmas(obj);
> -
>  		drm_prime_gem_destroy(obj, msm_obj->sgt);
>  	} else {
>  		msm_gem_vunmap(obj);
>  		put_pages(obj);
> -		put_iova_vmas(obj);
>  	}
>  
>  	drm_gem_object_release(obj);
> @@ -1104,7 +1131,6 @@ static int msm_gem_new_impl(struct drm_device *dev,
>  	msm_obj->madv = MSM_MADV_WILLNEED;
>  
>  	INIT_LIST_HEAD(&msm_obj->node);
> -	INIT_LIST_HEAD(&msm_obj->vmas);
>  
>  	*obj = &msm_obj->base;
>  	(*obj)->funcs = &msm_gem_object_funcs;
> diff --git a/drivers/gpu/drm/msm/msm_gem.h b/drivers/gpu/drm/msm/msm_gem.h
> index 9bd78642671c..5091892bbe2e 100644
> --- a/drivers/gpu/drm/msm/msm_gem.h
> +++ b/drivers/gpu/drm/msm/msm_gem.h
> @@ -10,6 +10,7 @@
>  #include <linux/kref.h>
>  #include <linux/dma-resv.h>
>  #include "drm/drm_exec.h"
> +#include "drm/drm_gpuvm.h"
>  #include "drm/gpu_scheduler.h"
>  #include "msm_drv.h"
>  
> @@ -22,30 +23,67 @@
>  #define MSM_BO_STOLEN        0x10000000    /* try to use stolen/splash memory */
>  #define MSM_BO_MAP_PRIV      0x20000000    /* use IOMMU_PRIV when mapping */
>  
> +/**
> + * struct msm_gem_vm - VM object
> + *
> + * A VM object representing a GPU (or display or GMU or ...) virtual address
> + * space.
> + *
> + * In the case of GPU, if per-process address spaces are supported, the address
> + * space is split into two VMs, which map to TTBR0 and TTBR1 in the SMMU.  TTBR0
> + * is used for userspace objects, and is unique per msm_context/drm_file, while
> + * TTBR1 is the same for all processes.  (The kernel controlled ringbuffer and
> + * a few other kernel controlled buffers live in TTBR1.)
> + *
> + * The GPU TTBR0 vm can be managed by userspace or by the kernel, depending on
> + * whether userspace supports VM_BIND.  All other vm's are managed by the kernel.
> + * (Managed by kernel means the kernel is responsible for VA allocation.)
> + *
> + * Note that because VM_BIND allows a given BO to be mapped multiple times in
> + * a VM, and therefore have multiple VMA's in a VM, there is an extra object
> + * provided by drm_gpuvm infrastructure.. the drm_gpuvm_bo, which is not
> + * embedded in any larger driver structure.  The GEM object holds a list of
> + * drm_gpuvm_bo, which in turn holds a list of msm_gem_vma.  A linked vma
> + * holds a reference to the vm_bo, and drops it when the vma is unlinked.
> + * So we just need to call drm_gpuvm_bo_obtain() to return a ref to an
> + * existing vm_bo, or create a new one.  Once the vma is linked, the ref
> + * to the vm_bo can be dropped (since the vma is holding one).
> + */
>  struct msm_gem_vm {
> -	const char *name;
> -	/* NOTE: mm managed at the page level, size is in # of pages
> -	 * and position mm_node->start is in # of pages:
> +	/** @base: Inherit from drm_gpuvm. */
> +	struct drm_gpuvm base;
> +
> +	/**
> +	 * @mm: Memory management for kernel managed VA allocations
> +	 *
> +	 * Only used for kernel managed VMs, unused for user managed VMs.
> +	 *
> +	 * Protected by @mm_lock.
>  	 */
>  	struct drm_mm mm;
> -	spinlock_t lock; /* Protects drm_mm node allocation/removal */
> +
> +	/** @mm_lock: protects @mm node allocation/removal */
> +	struct spinlock mm_lock;
> +
> +	/** @vm_lock: protects gpuvm insert/remove/traverse */
> +	struct mutex vm_lock;
> +
> +	/** @mmu: The mmu object which manages the pgtables */
>  	struct msm_mmu *mmu;
> -	struct kref kref;
>  
> -	/* For address spaces associated with a specific process, this
> +	/**
> +	 * @pid: For address spaces associated with a specific process, this
>  	 * will be non-NULL:
>  	 */
>  	struct pid *pid;
>  
> -	/* @faults: the number of GPU hangs associated with this address space */
> +	/** @faults: the number of GPU hangs associated with this address space */
>  	int faults;
>  
> -	/** @va_start: lowest possible address to allocate */
> -	uint64_t va_start;
> -
> -	/** @va_size: the size of the address space (in bytes) */
> -	uint64_t va_size;
> +	/** @managed: is this a kernel managed VM? */
> +	bool managed;
>  };
> +#define to_msm_vm(x) container_of(x, struct msm_gem_vm, base)
>  
>  struct msm_gem_vm *
>  msm_gem_vm_get(struct msm_gem_vm *vm);
> @@ -53,18 +91,31 @@ msm_gem_vm_get(struct msm_gem_vm *vm);
>  void msm_gem_vm_put(struct msm_gem_vm *vm);
>  
>  struct msm_gem_vm *
> -msm_gem_vm_create(struct msm_mmu *mmu, const char *name,
> -		u64 va_start, u64 size);
> +msm_gem_vm_create(struct drm_device *drm, struct msm_mmu *mmu, const char *name,
> +		  u64 va_start, u64 va_size, bool managed);
>  
>  struct msm_fence_context;
>  
> +/**
> + * struct msm_gem_vma - a VMA mapping
> + *
> + * Represents a combination of a GEM object plus a VM.
> + */
>  struct msm_gem_vma {
> +	/** @base: inherit from drm_gpuva */
> +	struct drm_gpuva base;
> +
> +	/**
> +	 * @node: mm node for VA allocation
> +	 *
> +	 * Only used by kernel managed VMs
> +	 */
>  	struct drm_mm_node node;
> -	uint64_t iova;
> -	struct msm_gem_vm *vm;
> -	struct list_head list;    /* node in msm_gem_object::vmas */
> +
> +	/** @mapped: Is this VMA mapped? */
>  	bool mapped;
>  };
> +#define to_msm_vma(x) container_of(x, struct msm_gem_vma, base)
>  
>  struct msm_gem_vma *
>  msm_gem_vma_new(struct msm_gem_vm *vm, struct drm_gem_object *obj,
> @@ -100,8 +151,6 @@ struct msm_gem_object {
>  	struct sg_table *sgt;
>  	void *vaddr;
>  
> -	struct list_head vmas;    /* list of msm_gem_vma */
> -
>  	char name[32]; /* Identifier to print for the debugfs files */
>  
>  	/* userspace metadata backchannel */
> diff --git a/drivers/gpu/drm/msm/msm_gem_submit.c b/drivers/gpu/drm/msm/msm_gem_submit.c
> index a186b7dfea35..e8a670566147 100644
> --- a/drivers/gpu/drm/msm/msm_gem_submit.c
> +++ b/drivers/gpu/drm/msm/msm_gem_submit.c
> @@ -312,7 +312,7 @@ static int submit_pin_objects(struct msm_gem_submit *submit)
>  		if (ret)
>  			break;
>  
> -		submit->bos[i].iova = vma->iova;
> +		submit->bos[i].iova = vma->base.va.addr;
>  	}
>  
>  	/*
> diff --git a/drivers/gpu/drm/msm/msm_gem_vma.c b/drivers/gpu/drm/msm/msm_gem_vma.c
> index ca29e81d79d2..56221dfdf551 100644
> --- a/drivers/gpu/drm/msm/msm_gem_vma.c
> +++ b/drivers/gpu/drm/msm/msm_gem_vma.c
> @@ -5,14 +5,13 @@
>   */
>  
>  #include "msm_drv.h"
> -#include "msm_fence.h"
>  #include "msm_gem.h"
>  #include "msm_mmu.h"
>  
>  static void
> -msm_gem_vm_destroy(struct kref *kref)
> +msm_gem_vm_free(struct drm_gpuvm *gpuvm)
>  {
> -	struct msm_gem_vm *vm = container_of(kref, struct msm_gem_vm, kref);
> +	struct msm_gem_vm *vm = container_of(gpuvm, struct msm_gem_vm, base);
>  
>  	drm_mm_takedown(&vm->mm);
>  	if (vm->mmu)
> @@ -25,14 +24,14 @@ msm_gem_vm_destroy(struct kref *kref)
>  void msm_gem_vm_put(struct msm_gem_vm *vm)
>  {
>  	if (vm)
> -		kref_put(&vm->kref, msm_gem_vm_destroy);
> +		drm_gpuvm_put(&vm->base);
>  }
>  
>  struct msm_gem_vm *
>  msm_gem_vm_get(struct msm_gem_vm *vm)
>  {
>  	if (!IS_ERR_OR_NULL(vm))
> -		kref_get(&vm->kref);
> +		drm_gpuvm_get(&vm->base);
>  
>  	return vm;
>  }
> @@ -40,14 +39,14 @@ msm_gem_vm_get(struct msm_gem_vm *vm)
>  /* Actually unmap memory for the vma */
>  void msm_gem_vma_purge(struct msm_gem_vma *vma)
>  {
> -	struct msm_gem_vm *vm = vma->vm;
> -	unsigned size = vma->node.size;
> +	struct msm_gem_vm *vm = to_msm_vm(vma->base.vm);
> +	unsigned size = vma->base.va.range;
>  
>  	/* Don't do anything if the memory isn't mapped */
>  	if (!vma->mapped)
>  		return;
>  
> -	vm->mmu->funcs->unmap(vm->mmu, vma->iova, size);
> +	vm->mmu->funcs->unmap(vm->mmu, vma->base.va.addr, size);
>  
>  	vma->mapped = false;
>  }
> @@ -57,10 +56,10 @@ int
>  msm_gem_vma_map(struct msm_gem_vma *vma, int prot,
>  		struct sg_table *sgt, int size)
>  {
> -	struct msm_gem_vm *vm = vma->vm;
> +	struct msm_gem_vm *vm = to_msm_vm(vma->base.vm);
>  	int ret;
>  
> -	if (GEM_WARN_ON(!vma->iova))
> +	if (GEM_WARN_ON(!vma->base.va.addr))
>  		return -EINVAL;
>  
>  	if (vma->mapped)
> @@ -68,9 +67,6 @@ msm_gem_vma_map(struct msm_gem_vma *vma, int prot,
>  
>  	vma->mapped = true;
>  
> -	if (!vm)
> -		return 0;
> -
>  	/*
>  	 * NOTE: iommu/io-pgtable can allocate pages, so we cannot hold
>  	 * a lock across map/unmap which is also used in the job_run()
> @@ -80,7 +76,7 @@ msm_gem_vma_map(struct msm_gem_vma *vma, int prot,
>  	 * Revisit this if we can come up with a scheme to pre-alloc pages
>  	 * for the pgtable in map/unmap ops.
>  	 */
> -	ret = vm->mmu->funcs->map(vm->mmu, vma->iova, sgt, size, prot);
> +	ret = vm->mmu->funcs->map(vm->mmu, vma->base.va.addr, sgt, size, prot);
>  
>  	if (ret) {
>  		vma->mapped = false;
> @@ -92,19 +88,20 @@ msm_gem_vma_map(struct msm_gem_vma *vma, int prot,
>  /* Close an iova.  Warn if it is still in use */
>  void msm_gem_vma_close(struct msm_gem_vma *vma)
>  {
> -	struct msm_gem_vm *vm = vma->vm;
> +	struct msm_gem_vm *vm = to_msm_vm(vma->base.vm);
>  
>  	GEM_WARN_ON(vma->mapped);
>  
> -	spin_lock(&vm->lock);
> -	if (vma->iova)
> +	spin_lock(&vm->mm_lock);
> +	if (vma->base.va.addr)
>  		drm_mm_remove_node(&vma->node);
> -	spin_unlock(&vm->lock);
> +	spin_unlock(&vm->mm_lock);
>  
> -	vma->iova = 0;
> -	list_del(&vma->list);
> +	mutex_lock(&vm->vm_lock);
> +	drm_gpuva_remove(&vma->base);
> +	drm_gpuva_unlink(&vma->base);
> +	mutex_unlock(&vm->vm_lock);
>  
> -	msm_gem_vm_put(vm);
>  	kfree(vma);
>  }
>  
> @@ -113,6 +110,7 @@ struct msm_gem_vma *
>  msm_gem_vma_new(struct msm_gem_vm *vm, struct drm_gem_object *obj,
>  		u64 range_start, u64 range_end)
>  {
> +	struct drm_gpuvm_bo *vm_bo;
>  	struct msm_gem_vma *vma;
>  	int ret;
>  
> @@ -120,36 +118,82 @@ msm_gem_vma_new(struct msm_gem_vm *vm, struct drm_gem_object *obj,
>  	if (!vma)
>  		return ERR_PTR(-ENOMEM);
>  
> -	vma->vm = vm;
> +	if (vm->managed) {
> +		spin_lock(&vm->mm_lock);
> +		ret = drm_mm_insert_node_in_range(&vm->mm, &vma->node,
> +						obj->size, PAGE_SIZE, 0,
> +						range_start, range_end, 0);
> +		spin_unlock(&vm->mm_lock);
>  
> -	spin_lock(&vm->lock);
> -	ret = drm_mm_insert_node_in_range(&vm->mm, &vma->node,
> -					  obj->size, PAGE_SIZE, 0,
> -					  range_start, range_end, 0);
> -	spin_unlock(&vm->lock);
> +		if (ret)
> +			goto err_free_vma;
>  
> -	if (ret)
> -		goto err_free_vma;
> +		range_start = vma->node.start;
> +		range_end   = range_start + obj->size;
> +	}
>  
> -	vma->iova = vma->node.start;
> +	GEM_WARN_ON((range_end - range_start) > obj->size);
> +
> +	drm_gpuva_init(&vma->base, range_start, range_end - range_start, obj, 0);
>  	vma->mapped = false;
>  
> -	INIT_LIST_HEAD(&vma->list);
> +	mutex_lock(&vm->vm_lock);
> +	ret = drm_gpuva_insert(&vm->base, &vma->base);
> +	mutex_unlock(&vm->vm_lock);
> +	if (ret)
> +		goto err_free_range;
>  
> -	kref_get(&vm->kref);
> +	vm_bo = drm_gpuvm_bo_obtain(&vm->base, obj);
> +	if (IS_ERR(vm_bo)) {
> +		ret = PTR_ERR(vm_bo);
> +		goto err_va_remove;
> +	}
> +
> +	mutex_lock(&vm->vm_lock);
> +	drm_gpuva_link(&vma->base, vm_bo);
> +	mutex_unlock(&vm->vm_lock);
> +	GEM_WARN_ON(drm_gpuvm_bo_put(vm_bo));
>  
>  	return vma;
>  
> +err_va_remove:
> +	mutex_lock(&vm->vm_lock);
> +	drm_gpuva_remove(&vma->base);
> +	mutex_unlock(&vm->vm_lock);
> +err_free_range:
> +	if (vm->managed)
> +		drm_mm_remove_node(&vma->node);
>  err_free_vma:
>  	kfree(vma);
>  	return ERR_PTR(ret);
>  }
>  
> +static const struct drm_gpuvm_ops msm_gpuvm_ops = {
> +	.vm_free = msm_gem_vm_free,
> +};
> +
> +/**
> + * msm_gem_vm_create() - Create and initialize a &msm_gem_vm
> + * @drm: the drm device
> + * @mmu: the backing MMU objects handling mapping/unmapping
> + * @name: the name of the VM
> + * @va_start: the start offset of the GPU VA space
> + * @va_size: the size of the GPU VA space

This function is used on the KMS side too. So "GPU/KMS"?

-Akhil

> + * @managed: is it a kernel managed VM?
> + *
> + * In a kernel managed VM, the kernel handles address allocation, and only
> + * synchronous operations are supported.  In a user managed VM, userspace
> + * handles virtual address allocation, and both async and sync operations
> + * are supported.
> + */
>  struct msm_gem_vm *
> -msm_gem_vm_create(struct msm_mmu *mmu, const char *name,
> -		u64 va_start, u64 size)
> +msm_gem_vm_create(struct drm_device *drm, struct msm_mmu *mmu, const char *name,
> +		  u64 va_start, u64 va_size, bool managed)
>  {
> +	enum drm_gpuvm_flags flags = managed ? DRM_GPUVM_VA_WEAK_REF : 0;
>  	struct msm_gem_vm *vm;
> +	struct drm_gem_object *dummy_gem;
> +	int ret = 0;
>  
>  	if (IS_ERR(mmu))
>  		return ERR_CAST(mmu);
> @@ -158,15 +202,28 @@ msm_gem_vm_create(struct msm_mmu *mmu, const char *name,
>  	if (!vm)
>  		return ERR_PTR(-ENOMEM);
>  
> -	spin_lock_init(&vm->lock);
> -	vm->name = name;
> -	vm->mmu = mmu;
> -	vm->va_start = va_start;
> -	vm->va_size  = size;
> +	dummy_gem = drm_gpuvm_resv_object_alloc(drm);
> +	if (!dummy_gem) {
> +		ret = -ENOMEM;
> +		goto err_free_vm;
> +	}
> +
> +	drm_gpuvm_init(&vm->base, name, flags, drm, dummy_gem,
> +		       va_start, va_size, 0, 0, &msm_gpuvm_ops);
> +	drm_gem_object_put(dummy_gem);
> +
> +	spin_lock_init(&vm->mm_lock);
> +	mutex_init(&vm->vm_lock);
>  
> -	drm_mm_init(&vm->mm, va_start, size);
> +	vm->mmu = mmu;
> +	vm->managed = managed;
>  
> -	kref_init(&vm->kref);
> +	drm_mm_init(&vm->mm, va_start, va_size);
>  
>  	return vm;
> +
> +err_free_vm:
> +	kfree(vm);
> +	return ERR_PTR(ret);
> +
>  }
> diff --git a/drivers/gpu/drm/msm/msm_kms.c b/drivers/gpu/drm/msm/msm_kms.c
> index 88504c4b842f..6458bd82a0cd 100644
> --- a/drivers/gpu/drm/msm/msm_kms.c
> +++ b/drivers/gpu/drm/msm/msm_kms.c
> @@ -204,8 +204,8 @@ struct msm_gem_vm *msm_kms_init_vm(struct drm_device *dev)
>  		return NULL;
>  	}
>  
> -	vm = msm_gem_vm_create(mmu, "mdp_kms",
> -		0x1000, 0x100000000 - 0x1000);
> +	vm = msm_gem_vm_create(dev, mmu, "mdp_kms",
> +			       0x1000, 0x100000000 - 0x1000, true);
>  	if (IS_ERR(vm)) {
>  		dev_err(mdp_dev, "vm create, error %pe\n", vm);
>  		mmu->funcs->destroy(mmu);