![]() |
1
1
对。
编译器可以观察到结果将始终为11.1x22.2,因此它只需将该值(当
如果你想看到mul指令,请将乘法输入值设置为内核参数:
任何适当的优化仍然必须在全局状态下具有相同的结果。因此,在这种情况下,用一个
|
|
luxuia · 内联PTX是否比C/C++代码更高效? 11 年前 |