目的
测试并优化Linux内核收包
ixgbe收包
前期设置:cpu和网卡队列一一绑定,service irqbalance stop等。
rx_ring->rx_buffer_info[]是收包用的循环队列。rx_ring中关于循环队列的一些重要变量:
1 2 3 4 |
|
假设收包队列为512,那么ixgbe初始化之后
1 2 3 |
|
这里刚好留了一个位置没申请内存,这个跟reuse有关,后面再看。
初始化流程:
ixgbe_up() -> ixgbe_configure() -> ixgbe_configure_rx() -> ixgbe_configure_rx_ring() -> ixgbe_alloc_rx_buffers(ring, ixgbe_desc_unused(ring))
ixgbe_desc_unused 决定了预留一个位置。
1 2 3 4 5 6 7 |
|
收包函数 ixgbe_clean_rx_irq 简化流程为
- 预先申请内存,为[next_to_use, next_to_clean)这段“没申请”内存的队列申请
1 2 3 4 |
|
- 检查是否收到数据
1 2 3 4 |
|
- 申请skb
1 2 3 4 5 |
|
- reuse buffer
1
|
|
- EOP
1 2 |
|
reuse buffer
先不看EOP、XDP, 流程就很简单,唯一问题是reuse buffer。
其实在ixgbe初始化时rx_ring->rx_buffer_info队列上每个位置申请的内存都可以放两个包的,假设rx_ring->rx_buffer_info[0]上的空间为b1、b2。
网卡收第一个包时,存在了b1,但b2没被使用,在ixgbe_put_rx_buffer()里将b2放到next_to_alloc里,所以前面初始化时至少要空一个位置。这时
1 2 3 |
|
b1、b2中间隔了510个包
当收第512个包时,网卡把它存在了b2,这时b1如果被消费了(大概率事件),那么b1又是可以被reuse,再把b1放到next_to_alloc。这样在skb及时消费的情况下就不用再申请内存给网卡。
EOP
EOP = End of Packet
如果收上来的数据没有EOP标志位,说明不是一个完整的包,要等后面的数据。
一个包对应一个skb结构,第一块数据到的时候就申请了skb,下一个数据到来的时候不需要再申请skb。
ixgbe做法是在ixgbe_is_non_eop()中将skb放到ntc=next_to_clean+1中的rx_ring->rx_buffer_info[ntc].skb = skb; 下一块数据到来时直接在ixgbe_get_rx_buffer()中取出这个skb,不需要再申请。之后收到的数据会依次放到skb_shinfo(skb)->frags[]中, 具体见ixgbe_add_rx_frag()。
XDP
XDP是在申请skb结构之前直接处理网卡收到的数据,如果要丢弃就不用申请skb了。
较新的Linux内核或官网驱动ixgbe-5.6.5中包含该功能。
测试
环境
ga-b250m-hd3 I5-6500, 4核4线程 X520-T1 ubuntu 16.04, linux-image-4.15.0-XX 主板设置只开启一核(直接丢包场景下增加核数处理能力线性增加)
netmap
netmap是一种网卡旁路方法,用netmap测试,只用一个cpu。 1个cpu, 2GHz, 12.8Mpps 100% 1个cpu, 3.6GHz,14.2Mpps 100%
模仿XDP丢包
ixgbe-5.6.5 的带了XDP功能, 在 ixgbe_run_xdp 直接 return ERR_PTR(-IXGBE_XDP_CONSUMED); 也就是全部丢包。 1个cpu, 2GHz, 14.2Mpps <20% ? 用 ixgbe-5.3.8 加上XDP功能 cpu需要 93% 1个cpu, 3.6GHz,14.2Mpps <10% ? 用 ixgbe-5.3.8 加上XDP功能 cpu需要 30%
pre_routing 丢包
1个cpu, 2GHz, 3.2Mpps 100% 1个cpu, 3.6GHz,5.5Mpps 100%
local_in 丢包
1个cpu, 2GHz, 1.2Mpps 100% 1个cpu, 3.6GHz,2.1Mpps 100% local_in比pre_routing多了路由查找,这个都太慢。
不处理
1个cpu, 2GHz, 1.2Mpps 100% 1个cpu, 3.6GHz,2.1Mpps 100%