![]() |
1
5
这还不是一个库,但我已经为一个研究项目开发了一堆矩阵乘法的例子。它包含一个矢量化矩阵乘法内核,比NVIDA为OpenCL和CUDA提供的示例内核更快。它还包含一些运行OpenCL程序等的有用函数 源代码和项目如下: https://sites.google.com/site/jhosite/parallel-systems |