代码之家 › 专栏 › 技术社区 › Nils

CUDA在不同的平台上有不同的结果

cuda

Nils · 技术社区 · 14 年前

我在我的MacBookPro上写了一个小的CUDA程序,现在在我的Linux机器上试用,得到了不同的结果。

为了确保正确性,我编写了单元测试:将包含要检查的值的浮点数组复制到设备,然后再复制回来。最糟糕的是,它有时在Linux上返回不同的值(还有一些非常奇怪的值),但在我的Mac上,它每次都运行正常。

我在mac上的两个平台上都使用CUDA3.1,但是我必须编译它32位,因为64位CUDA还不受支持。Linux机器是x64和Ubuntu10.04(gcc是4.3.4),Mac上的gcc版本是i686-apple-darwin10-gcc-4.2.1。

GPU位于Mac GeForce 9600M GT(计算能力1.1)和PC GeForce GTX 285或Telsa C1060(计算能力1.3)上

我又做了一些检查,确保数据被完全读入,但到目前为止,我还不能确定问题的所在,如何找出问题的根源?

#include <stdio.h>

__device__ void testFunc(float *ptr)
{
    *ptr = 3.4;
}

__global__ void testkernel(float* validation_data, int n)
{
    for(int i=0; i<100; i++)
        validation_data[i] = 666;

    float *ptr;
    testFunc(ptr);
    validation_data[0] = *ptr;
}

int main()
{  
    int n = 100;
    float *validation_data = (float*)malloc(sizeof(float)*100);
    float *validation_data_d;

    cudaMalloc((void**)&validation_data_d, sizeof(float)*n);

    testkernel <<<1,1>>> (validation_data_d, n);

    // Copy the array back again.
    cudaMemcpy(validation_data, validation_data_d, sizeof(float)*n,
        cudaMemcpyDeviceToHost);

    for(int i=0; i<n; i++)
        printf("%f ", validation_data[i]);
    printf("\n");
}

1 回复 | 直到 14 年前

Bill Lynch 12 年前

这是未定义的行为。您正在取消对未定义指针的引用。

float *ptr;
testFunc(ptr);

__device__ void testFunc(float &val)
{
    val = 3.4;
}

...
        float val;
        testFunc(&val);
        validation_data[0] = val;
...

推荐文章

mike · 音频速率下的OpenCL/CUDA GPU计算-是否有足够快的方法可以在每个音频缓冲区从GPU读取一次?(即最低约43 FPS)

10 月前

sof · cuobjdump不发出PTX算术指令

11 月前

armagedescu · 内联结构初始化,“非静态成员必须相对于静态对象”

11 月前

sof · 矩阵乘法样本中共享存储器的放置

1 年前

asmo_192 · CUDA(Libtorch)和OpenGL互操作的怪异行为

1 年前

Okhr · 运行时错误:CUDA错误:在带有GTX 1660 Super的Debian 12虚拟机上不支持此操作

1 年前

Sampath · CUDA内核,用于查找1D阵列中大于特定阈值的值的最小和最大索引

1 年前

Rahn · 将GPU内存分配给类的成员变量的正确方法是什么?

1 年前

Marko GrdiniÄ · 如何在CuPy项目中包含Cutlass?

1 年前

Athanasios Margaris · 如何将CUDA线程与三重嵌套循环相关联?

1 年前