|
1
1
设S(U,N)表示在系统U上获得的加速,其中基线程序(加速公式中的分子)使用1个线程,而改进程序使用N个线程。即: S(U,N)=时间 U (1) /次 (N) 因此:
这意味着: 时间 至强 (1) /次 至强 瑞森 (1) /次 瑞森 缩放 表演 至强 (8) >时间 (8).
S(Xeon,8)>S(Xeon,4)
时间 至强 (1) /次 (8) >时间 至强 两次 至强 时间 至强 (8) 现在是关键的观察。为什么我们能够从两个给定的加速中推断出两个执行时间在同一个CPU上但在两个不同的CPU上是如何相关的?因为在同一个CPU上,两个加速的基线是相同的,这使我们能够相互抵消它们。
s 裁判 威拉米特 (1) /次 U (N) 基本上,时间 威拉米特 (U,N)如下: S(U,N)=S 裁判 裁判 (U,1) 那么如果 裁判 (至强,8)>s (Xeon,4),那么从数学上来说,推断时间是有效的 至强 至强 (4). 如果S (至强,8)>s (8) <时间 (8). 两个S之间的给定关系 裁判 (U,N)与使用S(U,N)相比,相同或不同CPU上的加速比包含更多信息。 这个 SPEC CPU benchmark suite uses a machine from 1997 :
规格CPU 2017使用 a more modern machine from 2006 :
无论是来自同一系统还是不同系统,都可以对规范化的数字进行相互比较。 因此,参考系统应该是最现代的系统,它比所有感兴趣的系统(即,可以相互比较的系统)都要古老(尤其慢)。 |
|
Sweepy Dodo · JSON lite的格式化 1 年前 |
|
|
giantjenga · 优化整数向量到二进制向量的转换 1 年前 |
|
Zegarek · Postgresql递归查询未提供预期结果 1 年前 |
|
|
Joe · 为什么这两个查询之间的性能存在如此大的差异? 1 年前 |
|
tic-toc-choc · 在`dplyr中高效使用列表进行过滤` 1 年前 |