代码之家 › 专栏 › 技术社区 › Antonin GAVREL

从double转换为m128

intrinsics inline-assembly sse assembly c++

Antonin GAVREL · 技术社区 · 5 年前

我正在寻找一种方法,将double转换为a_m128,以利用内部指令。

我试着用:

double d = 7654321.1234567;
_m128 ret =  *reinterpret_cast<__m128*>(d);

error: invalid cast from type âdoubleâ to type â__m128* {aka __vector(4) float*}â

任何帮助将非常感谢,内联装配解决方案是好的~

1 回复 | 直到 5 年前

Peter Cordes 5 年前

假设你真的想要 double ( __m128d ),你在找 _mm_set_sd(d) 将双精度扩展到零喜欢 _mm_set_pd(0, d) .

见 Intel's intrinsics guide (double 找到需要 (或 double* )阿格。

__m128 是4的向量 float ;是否要将双->浮点转换为向量的低位元素?就像 _mm_set_ps(0.f, 0.f, 0.f, d);

__m128d* 因为向量的宽度是 双重的 . 如果有什么能说得通的话 (__m128d)d 或者是一个静态的或者重新解释的版本。

一些编译器(很可能仍然只是叮当声)可以优化零扩展或广播到 __m128d型 向量,如果只使用标量内部函数,然后提取标量结果。其他编译器实际上是在上层元素上浪费指令。

推荐文章

NULL · 使用按位AND和popcount而不是实际整数或浮点乘法的大(0,1)矩阵乘法?

7 年前

Dave · 3D矢量的SSE对齐

9 年前

Green goblin · 乱序16位矢量SSE

9 年前

John · 两个8位阵列协方差的快速实现

9 年前

Rames · XMM寄存器的位取反

9 年前

ishaan arora · 在C中将代码从SSE2转换为SSE4

9 年前

warunapww Krishna · PADDD指令的操作数

9 年前

Thomas · FMA指令集的硬件支持有多丰富

9 年前

jiandingzhe · 这些128位SIMD异或运算[重复]之间的区别是什么

10 年前

user1095108 · 向量*矩阵产品效率问题

10 年前