代码之家 › 专栏 › 技术社区 › Whoami

为什么全局内存的分配比GPU中的大小更成功?

imx6 gpgpu gpu opencl

Whoami · 技术社区 · 6 年前

我正在试用Vivante GPU GC2000系列,其中clinfo产生了以下结果。

 CL_DEVICE_GLOBAL_MEM_SIZE:             64 MByte
 CL_DEVICE_MAX_MEM_ALLOC_SIZE:          32 MByte
 CL_DEVICE_GLOBAL_MEM_CACHE_TYPE:       Read/Write
 CL_DEVICE_GLOBAL_MEM_CACHELINE_SIZE:       64
 CL_DEVICE_GLOBAL_MEM_CACHE_SIZE:       4096
 CL_DEVICE_LOCAL_MEM_SIZE:          1 KByte
 CL_DEVICE_LOCAL_MEM_TYPE:          Global
 CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE:        4 KByte
 CL_DEVICE_MAX_CONSTANT_ARGS:           9

从上面的输出可以清楚地看出,64MB是全局内存分配的限制。

现在,当我尝试分配900MB的全局大小时,我没有收到任何错误,它是成功的。

int noOfBytes = (900 * 1024 * 1024);
memPtr = clCreateBuffer(context, CL_MEM_READ_WRITE, noOfBytes, NULL, &err);
 if ( err != CL_SUCESS) {
    printf ("Ooops.. Failed");
  }

1 回复 | 直到 6 年前

Dithermaster 6 年前

因为缓冲区和图像是在OpenCL上分配的 上下文 (不是OpenCL )实际的设备分配通常被推迟到缓冲区在特定设备上使用。因此,虽然这个分配似乎是有效的,但是如果你试图在你的设备上实际使用这个缓冲区,你会得到一个错误。

推荐文章

cfuqua · 使用驱动程序API创建纹理对象时发生JCuda访问冲突

7 年前

lawful_neutral · 具有映射内存、统一虚拟寻址和统一内存的GPU内存超额订阅

7 年前

a_sid · 我可以将jpeg或mjpeg文件从硬盘传输到GPU内存吗?

7 年前

ProEns08 · cuDNN库是否适用于All nvidia图形卡?

9 年前

Zach Dwiel · 如何计算Theano中的GPU内存使用量?

9 年前

user3116936 · 当X Server打开时,大型阵列的内核超时

9 年前

Controller · 用推力排序Cuda中的2D阵列

10 年前

chafner · C++函数调用后SSBO的内容无效

10 年前

Kukunin · 如何扩展GPGPU的顶点着色器功能

10 年前

mrei · 参数超过256字节的CUDA内核调用的想法

11 年前