我试图理解AMD64 ABI所描述的
here
.我不明白的是堆栈对齐和大操作数(
__m256
,
__m512
).以下是相关报价:
输入参数区域的末端应在一个平面上对齐
16(32或64,如果有
__m256
或
__m512
在堆栈)字节边界上传递。
换句话说,价值
(%rsp+ 8)
始终是16(32或64)的倍数
当控制转移到功能入口点时。堆栈
指针,
%rsp
框架
我解释了关于
__m256
和
__m512
就这样我们推动
ymmN
,
zmmN
push
指示你能解释一下这是什么意思吗?