代码之家 › 专栏 › 技术社区 › Vincent

在两个内联程序集调用中内存被破坏,而在一个内联程序集调用中内存被破坏?

cpuid inline-assembly assembly gcc c++

2

Vincent · 技术社区 · 8 年前

这个问题紧随其后 one ,考虑 GCC -兼容编译器和 x86-64 建筑学

我想知道 option 1 , option 2 和 option 3 在下面结果在所有情况下是相同的,还是不同的。如果是这样的话,会有什么不同?

// Option 1
asm volatile(:::"memory");
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);

和

// Option 2
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);
asm volatile(:::"memory");

和

// Option 3
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):"memory");

1 回复 | 直到 8 年前

1

2

Peter Cordes 8 年前

选项1和;2将允许CPUID本身使用不相关的非- volatile 加载/存储(在一个方向或另一个方向)。这很可能不你想要什么。

你可以设置一个记忆障碍 二者都 CPUID的两个方面,但让CPUID本身成为内存屏障当然更好。

正如Jester指出的,选项1将强制重新加载 level 从内存中,如果它曾经将其地址传递到函数之外,或者如果它已经是全局或 static .

(或者,决定C变量是否可以由使用 "memory" 打击者。我认为这本质上与优化器用来决定变量是否可以在对不透明函数的非内联函数调用中保留在寄存器中的内容相同,因此,没有将地址传递到任何地方的纯局部变量,以及不是asm语句输入的纯局部变量,仍然可以存在于寄存器中)。

例如( Godbolt compiler explorer ):

void foo(int level){
    int eax, ebx, ecx, edx;
    asm volatile("":::"memory");
    asm volatile("CPUID"
        :  "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
        :  "0"(level)
        :
    );
}

# x86-64 gcc7.3  -O3 -fverbose-asm

    pushq   %rbx  #           # rbx is call-preserved, but we clobber it.
    movl    %edi, %eax      # level, eax
    CPUID
    popq    %rbx    #
    ret

请注意,函数arg没有溢出/重新加载。

通常我会使用Intel语法,但对于内联asm,最好始终使用AT&T除非您完全讨厌AT&T语法或不知道它。

即使它是在内存中启动的(i386 System V调用约定,带有堆栈参数),编译器仍然决定 asm 带有内存缓冲区的语句)可以引用它。但是,我们如何区分延迟加载和延迟加载的区别呢?在屏障前修改函数arg,然后在以下时间后使用:

void modify_level(int level){
    level += 1;                  // modify level before the barrier
    int eax, ebx, ecx, edx;
    asm volatile("#mem barrier here":::"memory");
    asm volatile("CPUID"         // then read it after
    :  "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
    :  "0"(level):);
}

asm输出来自 gcc -m32 -O3 -fverbose-asm 是:

modify_level(int):
    pushl   %ebx  #
    #mem barrier here
    movl    8(%esp), %eax   # level, tmp97
    addl    $1, %eax        #, level
    CPUID
    popl    %ebx    #
    ret

请注意,编译器让 level++ 跨内存屏障重新排序,因为它是一个局部变量。

Godbolt过滤手写的asm注释以及编译器生成的仅asm注释行。我禁用了评论过滤器并找到了mem屏障。您可能需要删除-fverbose asm以减少噪音。或者使用一个非注释字符串作为mem屏障:如果您只是查看编译器的asm输出,则不必进行组装。(除非您使用的是内置汇编程序的clang)。

顺便说一句,您的问题的原始版本没有编译:您遗漏了空字符串作为asm模板。 asm(:::"memory") . 输出、输入和clobber部分可以为空,但asm指令字符串不是可选的。

有趣的是,您可以在字符串中添加asm注释:

asm volatile("# memory barrier here":::"memory");

gcc填写任何 %whatever 在字符串模板中写入asm输出时,您甚至可以执行以下操作 "CPUID # %%0 was in %0" 并查看gcc为asm模板中未提及的“虚拟”参数选择了什么。(对于伪内存输入/输出操作数来说,告诉编译器您读/写的是哪个内存,而不是使用 “内存” 当你给asm语句一个指针时。)