tcp: do not pace pure ack packets

author Eric Dumazet <edumazet@google.com>

Wed, 4 Feb 2015 02:31:53 +0000 (18:31 -0800)

committer David S. Miller <davem@davemloft.net>

Thu, 5 Feb 2015 04:36:31 +0000 (20:36 -0800)
author Eric Dumazet <edumazet@google.com>
Wed, 4 Feb 2015 02:31:53 +0000 (18:31 -0800)
committer David S. Miller <davem@davemloft.net>
Thu, 5 Feb 2015 04:36:31 +0000 (20:36 -0800)
diff --git a/include/net/tcp.h b/include/net/tcp.h

index b8fdc6bab3f3ac9fe8d3992dc6105f9b857612b8..637ee490ec81605054777e559c93c3977ff6a230 100644 (file)
--- a/include/net/tcp.h
+++ b/include/net/tcp.h
@@ -1713,4 +1713,19 @@ static inline struct ip_options_rcu *tcp_v4_save_options(struct sk_buff *skb)
         return dopt;
  }
  
+/* locally generated TCP pure ACKs have skb->truesize == 2
+ * (check tcp_send_ack() in net/ipv4/tcp_output.c )
+ * This is much faster than dissecting the packet to find out.
+ * (Think of GRE encapsulations, IPv4, IPv6, ...)
+ */
+static inline bool skb_is_tcp_pure_ack(const struct sk_buff *skb)
+{
+       return skb->truesize == 2;
+}
+
+static inline void skb_set_tcp_pure_ack(struct sk_buff *skb)
+{
+       skb->truesize = 2;
+}
+
  #endif /* _TCP_H */
diff --git a/net/ipv4/tcp_output.c b/net/ipv4/tcp_output.c

index 20ab06b228ac3bcc599a80cc3dffab202a30e30a..1b326ed46f7b32bedde0ed80cc3c5ca3e3139723 100644 (file)
--- a/net/ipv4/tcp_output.c
+++ b/net/ipv4/tcp_output.c
@@ -948,7 +948,7 @@ static int tcp_transmit_skb(struct sock *sk, struct sk_buff *skb, int clone_it,
  
         skb_orphan(skb);
         skb->sk = sk;
-       skb->destructor = tcp_wfree;
+       skb->destructor = skb_is_tcp_pure_ack(skb) ? sock_wfree : tcp_wfree;
         skb_set_hash_from_sk(skb, sk);
         atomic_add(skb->truesize, &sk->sk_wmem_alloc);
  
@@ -3265,6 +3265,14 @@ void tcp_send_ack(struct sock *sk)
         skb_reserve(buff, MAX_TCP_HEADER);
         tcp_init_nondata_skb(buff, tcp_acceptable_seq(sk), TCPHDR_ACK);
  
+       /* We do not want pure acks influencing TCP Small Queues or fq/pacing
+        * too much.
+        * SKB_TRUESIZE(max(1 .. 66, MAX_TCP_HEADER)) is unfortunately ~784
+        * We also avoid tcp_wfree() overhead (cache line miss accessing
+        * tp->tsq_flags) by using regular sock_wfree()
+        */
+       skb_set_tcp_pure_ack(buff);
+
         /* Send it off, this clears delayed acks for us. */
         skb_mstamp_get(&buff->skb_mstamp);
         tcp_transmit_skb(sk, buff, 0, sk_gfp_atomic(sk, GFP_ATOMIC));
diff --git a/net/sched/sch_fq.c b/net/sched/sch_fq.c

index 2a50f5c62070a81ae37d871aac2626555128fd38..69a3dbf55c60271723e580b209282c8b3ae91ae8 100644 (file)
--- a/net/sched/sch_fq.c
+++ b/net/sched/sch_fq.c
@@ -52,6 +52,7 @@
  #include <net/pkt_sched.h>
  #include <net/sock.h>
  #include <net/tcp_states.h>
+#include <net/tcp.h>
  
  /*
   * Per flow structure, dynamically allocated
@@ -445,7 +446,9 @@ begin:
                 goto begin;
         }
  
-       if (unlikely(f->head && now < f->time_next_packet)) {
+       skb = f->head;
+       if (unlikely(skb && now < f->time_next_packet &&
+                    !skb_is_tcp_pure_ack(skb))) {
                 head->first = f->next;
                 fq_flow_set_throttled(q, f);
                 goto begin;
@@ -464,12 +467,15 @@ begin:
                 goto begin;
         }
         prefetch(&skb->end);
-       f->time_next_packet = now;
         f->credit -= qdisc_pkt_len(skb);
  
         if (f->credit > 0 || !q->rate_enable)
                 goto out;
  
+       /* Do not pace locally generated ack packets */
+       if (skb_is_tcp_pure_ack(skb))
+               goto out;
+
         rate = q->flow_max_rate;
         if (skb->sk)
                 rate = min(skb->sk->sk_pacing_rate, rate);
author	Eric Dumazet <edumazet@google.com>
	Wed, 4 Feb 2015 02:31:53 +0000 (18:31 -0800)
committer	David S. Miller <davem@davemloft.net>
	Thu, 5 Feb 2015 04:36:31 +0000 (20:36 -0800)
include/net/tcp.h		patch \| blob \| history
net/ipv4/tcp_output.c		patch \| blob \| history
net/sched/sch_fq.c		patch \| blob \| history