ipvlan: implement VEPA mode
authorMahesh Bandewar <maheshb@google.com>
Thu, 26 Oct 2017 22:09:25 +0000 (15:09 -0700)
committerDavid S. Miller <davem@davemloft.net>
Sun, 29 Oct 2017 09:39:57 +0000 (18:39 +0900)
This is very similar to the Macvlan VEPA mode, however, there is some
difference. IPvlan uses the mac-address of the lower device, so the VEPA
mode has implications of ICMP-redirects for packets destined for its
immediate neighbors sharing same master since the packets will have same
source and dest mac. The external switch/router will send redirect msg.

Having said that, this will be useful tool in terms of debugging
since IPvlan will not switch packets within its slaves and rely completely
on the external entity as intended in 802.1Qbg.

Signed-off-by: Mahesh Bandewar <maheshb@google.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
Documentation/networking/ipvlan.txt
drivers/net/ipvlan/ipvlan.h
drivers/net/ipvlan/ipvlan_core.c
drivers/net/ipvlan/ipvlan_main.c
include/uapi/linux/if_link.h

index bfa91c77a4c95624fa78eeaea0d48e4d0099d078..812ef003e0a8614c45476dddd2f6209ea387f5af 100644 (file)
@@ -25,7 +25,7 @@ using IProute2/ip utility.
     ip link add link <master> name <slave> type ipvlan [ mode MODE ] [ FLAGS ]
        where
          MODE: l3 (default) | l3s | l2
-         FLAGS: bridge (default) | private
+         FLAGS: bridge (default) | private | vepa
 
     e.g.
     (a) Following will create IPvlan link with eth0 as master in
@@ -35,6 +35,8 @@ using IProute2/ip utility.
           bash# ip link add link eth0 name ipvl0 type ipvlan mode l2 bridge
     (c) This command will create an IPvlan device in L2 private mode.
           bash# ip link add link eth0 name ipvlan type ipvlan mode l2 private
+    (d) This command will create an IPvlan device in L2 vepa mode.
+          bash# ip link add link eth0 name ipvlan type ipvlan mode l2 vepa
 
 
 4. Operating modes:
@@ -77,6 +79,14 @@ themseleves apart from talking through the master device.
        If this option is added to the command-line, the port is set in private
 mode. i.e. port wont allow cross communication between slaves.
 
+5.3 vepa:
+       If this is added to the command-line, the port is set in VEPA mode.
+i.e. port will offload switching functionality to the external entity as
+described in 802.1Qbg
+Note: VEPA mode in IPvlan has limitations. IPvlan uses the mac-address of the
+master-device, so the packets which are emitted in this mode for the adjacent
+neighbor will have source and destination mac same. This will make the switch /
+router send the redirect message.
 
 6. What to choose (macvlan vs. ipvlan)?
        These two devices are very similar in many regards and the specific use
index 9941851bcc139e4414fad16bc75fe106f735eae8..5166575a164d5ff1fde0c4fcf7bbd10537ac6932 100644 (file)
@@ -139,6 +139,21 @@ static inline void ipvlan_clear_private(struct ipvl_port *port)
        port->flags &= ~IPVLAN_F_PRIVATE;
 }
 
+static inline bool ipvlan_is_vepa(const struct ipvl_port *port)
+{
+       return !!(port->flags & IPVLAN_F_VEPA);
+}
+
+static inline void ipvlan_mark_vepa(struct ipvl_port *port)
+{
+       port->flags |= IPVLAN_F_VEPA;
+}
+
+static inline void ipvlan_clear_vepa(struct ipvl_port *port)
+{
+       port->flags &= ~IPVLAN_F_VEPA;
+}
+
 void ipvlan_init_secret(void);
 unsigned int ipvlan_mac_hash(const unsigned char *addr);
 rx_handler_result_t ipvlan_handle_frame(struct sk_buff **pskb);
index 72fd56de9c0015e5a46c1064b7dc105df401c449..034ae4c57196216fd2d5f928cbada3e8aaaf97e1 100644 (file)
@@ -514,13 +514,15 @@ static int ipvlan_xmit_mode_l3(struct sk_buff *skb, struct net_device *dev)
        if (!lyr3h)
                goto out;
 
-       addr = ipvlan_addr_lookup(ipvlan->port, lyr3h, addr_type, true);
-       if (addr) {
-               if (ipvlan_is_private(ipvlan->port)) {
-                       consume_skb(skb);
-                       return NET_XMIT_DROP;
+       if (!ipvlan_is_vepa(ipvlan->port)) {
+               addr = ipvlan_addr_lookup(ipvlan->port, lyr3h, addr_type, true);
+               if (addr) {
+                       if (ipvlan_is_private(ipvlan->port)) {
+                               consume_skb(skb);
+                               return NET_XMIT_DROP;
+                       }
+                       return ipvlan_rcv_frame(addr, &skb, true);
                }
-               return ipvlan_rcv_frame(addr, &skb, true);
        }
 out:
        ipvlan_skb_crossing_ns(skb, ipvlan->phy_dev);
@@ -535,7 +537,8 @@ static int ipvlan_xmit_mode_l2(struct sk_buff *skb, struct net_device *dev)
        void *lyr3h;
        int addr_type;
 
-       if (ether_addr_equal(eth->h_dest, eth->h_source)) {
+       if (!ipvlan_is_vepa(ipvlan->port) &&
+           ether_addr_equal(eth->h_dest, eth->h_source)) {
                lyr3h = ipvlan_get_L3_hdr(skb, &addr_type);
                if (lyr3h) {
                        addr = ipvlan_addr_lookup(ipvlan->port, lyr3h, addr_type, true);
index 4368afb1934c1d00144969d6382200e5ce70e4ee..a266aa435d4d6b267e47422555c694ce6c96b478 100644 (file)
@@ -478,6 +478,11 @@ static int ipvlan_nl_changelink(struct net_device *dev,
                        ipvlan_mark_private(port);
                else
                        ipvlan_clear_private(port);
+
+               if (flags & IPVLAN_F_VEPA)
+                       ipvlan_mark_vepa(port);
+               else
+                       ipvlan_clear_vepa(port);
        }
 
        return err;
@@ -506,8 +511,12 @@ static int ipvlan_nl_validate(struct nlattr *tb[], struct nlattr *data[],
        if (data[IFLA_IPVLAN_FLAGS]) {
                u16 flags = nla_get_u16(data[IFLA_IPVLAN_FLAGS]);
 
-               /* Only one bit is used at this moment. */
-               if (flags & ~IPVLAN_F_PRIVATE)
+               /* Only two bits are used at this moment. */
+               if (flags & ~(IPVLAN_F_PRIVATE | IPVLAN_F_VEPA))
+                       return -EINVAL;
+               /* Also both flags can't be active at the same time. */
+               if ((flags & (IPVLAN_F_PRIVATE | IPVLAN_F_VEPA)) ==
+                   (IPVLAN_F_PRIVATE | IPVLAN_F_VEPA))
                        return -EINVAL;
        }
 
index 052e32cd584cf7b5bd2efbd1fb1a8d932619c986..81f26473d728acde5c039737871cb39baac1d8d0 100644 (file)
@@ -479,6 +479,7 @@ enum ipvlan_mode {
 };
 
 #define IPVLAN_F_PRIVATE       0x01
+#define IPVLAN_F_VEPA          0x02
 
 /* VXLAN section */
 enum {