![]() |
1
2
实际上,我从来没有处理过DirectX,但是我可以用CUDA纹理来解释这种情况。纹理是简单数组(cudaArray或pitched array),具有缓存只读访问,存储在全局内存中。所以,512MB卡上一个大纹理的最大大小是512兆(实际上稍微小一点,但这还不够)。它被优化为访问2D空间中的数据(缓存为2D切片)。也可以在访问时转换坐标和值(有关详细信息,请参阅CUDA编程指南)。 不,不是所有的内存都在访问时缓存(对于计算能力为1.x的CUDA设备)。只有恒定和纹理记忆。具有计算能力的设备>=2.0(费米)使用L1和L2缓存缓存所有内存访问(或仅L2—可配置)。 |
![]() |
2
2
对于GF100生成,您仍然有专用的纹理缓存,但现在共享内存和一级缓存(缓存全局内存)之间共享相同的片上内存。如果您使用CUDA,您可以配置如何分割此内存。对于DirectX/OpenGL,图形驱动程序使用48KB共享内存/16KB一级缓存配置。
|
|
user8483278 · GPGPU的高级库 7 年前 |
![]() |
yuanyesjtu · CUDA gpu矢量[重复] 7 年前 |
![]() |
syeh_106 · Numpy是否自动检测并使用GPU? 7 年前 |
![]() |
Farzad · 序列化CUfunction对象 7 年前 |
![]() |
Vandana · 在以下矩阵副本内核中合并访问 7 年前 |
![]() |
Marek · opencv:裁剪GPU侧的图像 7 年前 |
![]() |
Yasin Kumar · 在caffe安装中安装python包时出错 7 年前 |