在求平方根时,我们执行数字**0.5,但0.5之前的-符号是什么意思。
我在看一个代码(我具体地看 ViT Code ,为了进行缩放,他们添加了:
self.scale = self.head_dim ** -0.5
请帮我理解它的含义。我在我的终端上做了一些实验,但不明白发生了什么:
>>> a = 4 >>> a**0.5 2.0 >>> >>> a**-0.5 0.5
互惠的 x**-n == 1/(x**n) 。。。。。。。
x**-n == 1/(x**n)