代码之家 › 专栏 › 技术社区 › user1202136

为什么GRO更高效?

offloading linux-kernel networking

user1202136 · 技术社区 · 8 年前

Generic Receive Offload (GRO)是Linux中的一种软件技术,用于聚合属于同一流的多个传入数据包。链接文章声称CPU利用率降低,因为不是每个数据包单独遍历网络堆栈,而是单个聚合数据包遍历网络堆栈。

然而,如果看一下GRO的源代码,这感觉就像一个网络堆栈本身。例如,传入的TCP/IPv4数据包需要经过:

每个函数都执行去封装,并查看相应的帧/网络/传输头,正如“常规”网络堆栈中预期的那样。

假设机器不执行防火墙/NAT或其他明显昂贵的每包处理,那么“常规”网络堆栈中的什么速度如此之慢,以至于“GRO网络堆栈”可以加速?

1 回复 | 直到 8 年前

Tgilgul 8 年前

:GRO在接收流中很早就完成了,因此它基本上减少了操作数量(GRO会话大小/MTU)。

更多细节 : 最常见的GRO函数是 napi_gro_receive()

这是Mellanox ConnectX-4Lx NIC接收流的一个很好的视觉表示(抱歉,这是我可以访问的):

如您所见,GRO聚合位于调用堆栈的最底层。你还可以看到之后做了多少工作。想象一下,如果这些函数中的每一个都在单个MTU上运行,您将有多大的开销。

希望这有帮助。

推荐文章

melonfsck · 是否允许在堆栈上分配旋转锁?

2 年前

devgirl05 · read(2)在哪里检查termios结构以确定它应该以(非)阻塞的方式读取STDIN?

2 年前

gulpr · printk只输出时间戳,不打印消息

2 年前

akash · RT补丁实施

2 年前

Sheng Wu · 编译Linux内核时,如何为每个.c文件生成所有.o文件?

2 年前

é¢åºæ° · git发送电子邮件--回复失败

2 年前

zebra_rey · 内核模块是提取设备寄存器的理想方式吗?

2 年前

MegaMagnum · 如何使用CMake和clangd设置VSC以使用Linux内核开发进行intellisense?

3 年前

hiddenbit · Userfaultfd不适用于Android应用程序?

3 年前

Mercurial · 如何在不像livepatch那样编译的情况下修改Linux内核头文件?

3 年前