|
|
1
6
是的,使用映射(即固定的“零拷贝”)方法,数据保留在主机内存中,并按需传输到GPU,但永远不会驻留在GPU内存中(除非GPU代码将其存储在那里)。如果您多次访问,可能需要从主机多次传输。 UVA(统一虚拟寻址,请参阅 here here )或者托管内存(=UM),所以我将把这个例子称为UM,而不是UVA。
使用UM plus CUDA 8.0或更高版本,再加上Pascal或更高版本的GPU,您可以使用UM(“托管”)分配超额订阅GPU内存。然后,这些分配名义上被限制为系统内存的大小(减去对系统内存的任何其他需求)。在这种情况下,CUDA运行时使用请求分页方法在主机和设备内存之间自动来回移动数据。
|
|
|
ProEns08 · cuDNN库是否适用于All nvidia图形卡? 10 年前 |
|
|
Zach Dwiel · 如何计算Theano中的GPU内存使用量? 10 年前 |
|
|
user3116936 · 当X Server打开时,大型阵列的内核超时 10 年前 |
|
|
Controller · 用推力排序Cuda中的2D阵列 11 年前 |
|
|
chafner · C++函数调用后SSBO的内容无效 11 年前 |
|
|
Kukunin · 如何扩展GPGPU的顶点着色器功能 11 年前 |
|
|
mrei · 参数超过256字节的CUDA内核调用的想法 12 年前 |