net: split out functions related to registering inflight socket files
authorJens Axboe <axboe@kernel.dk>
Fri, 8 Feb 2019 16:01:44 +0000 (09:01 -0700)
committerJens Axboe <axboe@kernel.dk>
Thu, 28 Feb 2019 15:24:23 +0000 (08:24 -0700)
We need this functionality for the io_uring file registration, but
we cannot rely on it since CONFIG_UNIX can be modular. Move the helpers
to a separate file, that's always builtin to the kernel if CONFIG_UNIX is
m/y.

No functional changes in this patch, just moving code around.

Reviewed-by: Hannes Reinecke <hare@suse.com>
Acked-by: David S. Miller <davem@davemloft.net>
Signed-off-by: Jens Axboe <axboe@kernel.dk>
include/net/af_unix.h
net/Makefile
net/unix/Kconfig
net/unix/Makefile
net/unix/af_unix.c
net/unix/garbage.c
net/unix/scm.c [new file with mode: 0644]
net/unix/scm.h [new file with mode: 0644]

index ddbba838d048df8f7d2d080442b77fa89130b561..3426d6dacc45ec86278dda0dfce36da7aef0a50f 100644 (file)
@@ -10,6 +10,7 @@
 
 void unix_inflight(struct user_struct *user, struct file *fp);
 void unix_notinflight(struct user_struct *user, struct file *fp);
+void unix_destruct_scm(struct sk_buff *skb);
 void unix_gc(void);
 void wait_for_unix_gc(void);
 struct sock *unix_get_socket(struct file *filp);
index bdaf53925acd5606fdb953800620bd05cf0f259e..449fc0b221f833fddf105f4f95c69e8ec85aa276 100644 (file)
@@ -18,7 +18,7 @@ obj-$(CONFIG_NETFILTER)               += netfilter/
 obj-$(CONFIG_INET)             += ipv4/
 obj-$(CONFIG_TLS)              += tls/
 obj-$(CONFIG_XFRM)             += xfrm/
-obj-$(CONFIG_UNIX)             += unix/
+obj-$(CONFIG_UNIX_SCM)         += unix/
 obj-$(CONFIG_NET)              += ipv6/
 obj-$(CONFIG_BPFILTER)         += bpfilter/
 obj-$(CONFIG_PACKET)           += packet/
index 8b31ab85d050f7b5930d53db5d69b6949865df4e..3b9e450656a4dfeef1a00afde58b2469f6b47b1c 100644 (file)
@@ -19,6 +19,11 @@ config UNIX
 
          Say Y unless you know what you are doing.
 
+config UNIX_SCM
+       bool
+       depends on UNIX
+       default y
+
 config UNIX_DIAG
        tristate "UNIX: socket monitoring interface"
        depends on UNIX
index ffd0a275c3a79ecaba7cd80ae7ef45b427ac3f60..54e58cc4f94502d9d888f60527a40bd2fd86b748 100644 (file)
@@ -10,3 +10,5 @@ unix-$(CONFIG_SYSCTL) += sysctl_net_unix.o
 
 obj-$(CONFIG_UNIX_DIAG)        += unix_diag.o
 unix_diag-y            := diag.o
+
+obj-$(CONFIG_UNIX_SCM) += scm.o
index 74d1eed7cbd4ea1c641db2fa9a104cc648715d24..2ce32dbb2feb10e4aa0edc65ff6e49f8b0a340bd 100644 (file)
 #include <linux/freezer.h>
 #include <linux/file.h>
 
+#include "scm.h"
+
 struct hlist_head unix_socket_table[2 * UNIX_HASH_SIZE];
 EXPORT_SYMBOL_GPL(unix_socket_table);
 DEFINE_SPINLOCK(unix_table_lock);
@@ -1486,67 +1488,6 @@ out:
        return err;
 }
 
-static void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
-{
-       int i;
-
-       scm->fp = UNIXCB(skb).fp;
-       UNIXCB(skb).fp = NULL;
-
-       for (i = scm->fp->count-1; i >= 0; i--)
-               unix_notinflight(scm->fp->user, scm->fp->fp[i]);
-}
-
-static void unix_destruct_scm(struct sk_buff *skb)
-{
-       struct scm_cookie scm;
-       memset(&scm, 0, sizeof(scm));
-       scm.pid  = UNIXCB(skb).pid;
-       if (UNIXCB(skb).fp)
-               unix_detach_fds(&scm, skb);
-
-       /* Alas, it calls VFS */
-       /* So fscking what? fput() had been SMP-safe since the last Summer */
-       scm_destroy(&scm);
-       sock_wfree(skb);
-}
-
-/*
- * The "user->unix_inflight" variable is protected by the garbage
- * collection lock, and we just read it locklessly here. If you go
- * over the limit, there might be a tiny race in actually noticing
- * it across threads. Tough.
- */
-static inline bool too_many_unix_fds(struct task_struct *p)
-{
-       struct user_struct *user = current_user();
-
-       if (unlikely(user->unix_inflight > task_rlimit(p, RLIMIT_NOFILE)))
-               return !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN);
-       return false;
-}
-
-static int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
-{
-       int i;
-
-       if (too_many_unix_fds(current))
-               return -ETOOMANYREFS;
-
-       /*
-        * Need to duplicate file references for the sake of garbage
-        * collection.  Otherwise a socket in the fps might become a
-        * candidate for GC while the skb is not yet queued.
-        */
-       UNIXCB(skb).fp = scm_fp_dup(scm->fp);
-       if (!UNIXCB(skb).fp)
-               return -ENOMEM;
-
-       for (i = scm->fp->count - 1; i >= 0; i--)
-               unix_inflight(scm->fp->user, scm->fp->fp[i]);
-       return 0;
-}
-
 static int unix_scm_to_skb(struct scm_cookie *scm, struct sk_buff *skb, bool send_fds)
 {
        int err = 0;
index f81854d74c7d42bb997b3ece0af7aac2e7f58db9..8bbe1b8e4ff7f3da19a1809dc75b6fac8d23e1f1 100644 (file)
 #include <net/scm.h>
 #include <net/tcp_states.h>
 
+#include "scm.h"
+
 /* Internal data structures and random procedures: */
 
-static LIST_HEAD(gc_inflight_list);
 static LIST_HEAD(gc_candidates);
-static DEFINE_SPINLOCK(unix_gc_lock);
 static DECLARE_WAIT_QUEUE_HEAD(unix_gc_wait);
 
-unsigned int unix_tot_inflight;
-
-struct sock *unix_get_socket(struct file *filp)
-{
-       struct sock *u_sock = NULL;
-       struct inode *inode = file_inode(filp);
-
-       /* Socket ? */
-       if (S_ISSOCK(inode->i_mode) && !(filp->f_mode & FMODE_PATH)) {
-               struct socket *sock = SOCKET_I(inode);
-               struct sock *s = sock->sk;
-
-               /* PF_UNIX ? */
-               if (s && sock->ops && sock->ops->family == PF_UNIX)
-                       u_sock = s;
-       } else {
-               /* Could be an io_uring instance */
-               u_sock = io_uring_get_socket(filp);
-       }
-       return u_sock;
-}
-
-/* Keep the number of times in flight count for the file
- * descriptor if it is for an AF_UNIX socket.
- */
-
-void unix_inflight(struct user_struct *user, struct file *fp)
-{
-       struct sock *s = unix_get_socket(fp);
-
-       spin_lock(&unix_gc_lock);
-
-       if (s) {
-               struct unix_sock *u = unix_sk(s);
-
-               if (atomic_long_inc_return(&u->inflight) == 1) {
-                       BUG_ON(!list_empty(&u->link));
-                       list_add_tail(&u->link, &gc_inflight_list);
-               } else {
-                       BUG_ON(list_empty(&u->link));
-               }
-               unix_tot_inflight++;
-       }
-       user->unix_inflight++;
-       spin_unlock(&unix_gc_lock);
-}
-
-void unix_notinflight(struct user_struct *user, struct file *fp)
-{
-       struct sock *s = unix_get_socket(fp);
-
-       spin_lock(&unix_gc_lock);
-
-       if (s) {
-               struct unix_sock *u = unix_sk(s);
-
-               BUG_ON(!atomic_long_read(&u->inflight));
-               BUG_ON(list_empty(&u->link));
-
-               if (atomic_long_dec_and_test(&u->inflight))
-                       list_del_init(&u->link);
-               unix_tot_inflight--;
-       }
-       user->unix_inflight--;
-       spin_unlock(&unix_gc_lock);
-}
-
 static void scan_inflight(struct sock *x, void (*func)(struct unix_sock *),
                          struct sk_buff_head *hitlist)
 {
diff --git a/net/unix/scm.c b/net/unix/scm.c
new file mode 100644 (file)
index 0000000..8c40f2b
--- /dev/null
@@ -0,0 +1,151 @@
+// SPDX-License-Identifier: GPL-2.0
+#include <linux/module.h>
+#include <linux/kernel.h>
+#include <linux/string.h>
+#include <linux/socket.h>
+#include <linux/net.h>
+#include <linux/fs.h>
+#include <net/af_unix.h>
+#include <net/scm.h>
+#include <linux/init.h>
+
+#include "scm.h"
+
+unsigned int unix_tot_inflight;
+EXPORT_SYMBOL(unix_tot_inflight);
+
+LIST_HEAD(gc_inflight_list);
+EXPORT_SYMBOL(gc_inflight_list);
+
+DEFINE_SPINLOCK(unix_gc_lock);
+EXPORT_SYMBOL(unix_gc_lock);
+
+struct sock *unix_get_socket(struct file *filp)
+{
+       struct sock *u_sock = NULL;
+       struct inode *inode = file_inode(filp);
+
+       /* Socket ? */
+       if (S_ISSOCK(inode->i_mode) && !(filp->f_mode & FMODE_PATH)) {
+               struct socket *sock = SOCKET_I(inode);
+               struct sock *s = sock->sk;
+
+               /* PF_UNIX ? */
+               if (s && sock->ops && sock->ops->family == PF_UNIX)
+                       u_sock = s;
+       } else {
+               /* Could be an io_uring instance */
+               u_sock = io_uring_get_socket(filp);
+       }
+       return u_sock;
+}
+EXPORT_SYMBOL(unix_get_socket);
+
+/* Keep the number of times in flight count for the file
+ * descriptor if it is for an AF_UNIX socket.
+ */
+void unix_inflight(struct user_struct *user, struct file *fp)
+{
+       struct sock *s = unix_get_socket(fp);
+
+       spin_lock(&unix_gc_lock);
+
+       if (s) {
+               struct unix_sock *u = unix_sk(s);
+
+               if (atomic_long_inc_return(&u->inflight) == 1) {
+                       BUG_ON(!list_empty(&u->link));
+                       list_add_tail(&u->link, &gc_inflight_list);
+               } else {
+                       BUG_ON(list_empty(&u->link));
+               }
+               unix_tot_inflight++;
+       }
+       user->unix_inflight++;
+       spin_unlock(&unix_gc_lock);
+}
+
+void unix_notinflight(struct user_struct *user, struct file *fp)
+{
+       struct sock *s = unix_get_socket(fp);
+
+       spin_lock(&unix_gc_lock);
+
+       if (s) {
+               struct unix_sock *u = unix_sk(s);
+
+               BUG_ON(!atomic_long_read(&u->inflight));
+               BUG_ON(list_empty(&u->link));
+
+               if (atomic_long_dec_and_test(&u->inflight))
+                       list_del_init(&u->link);
+               unix_tot_inflight--;
+       }
+       user->unix_inflight--;
+       spin_unlock(&unix_gc_lock);
+}
+
+/*
+ * The "user->unix_inflight" variable is protected by the garbage
+ * collection lock, and we just read it locklessly here. If you go
+ * over the limit, there might be a tiny race in actually noticing
+ * it across threads. Tough.
+ */
+static inline bool too_many_unix_fds(struct task_struct *p)
+{
+       struct user_struct *user = current_user();
+
+       if (unlikely(user->unix_inflight > task_rlimit(p, RLIMIT_NOFILE)))
+               return !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN);
+       return false;
+}
+
+int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
+{
+       int i;
+
+       if (too_many_unix_fds(current))
+               return -ETOOMANYREFS;
+
+       /*
+        * Need to duplicate file references for the sake of garbage
+        * collection.  Otherwise a socket in the fps might become a
+        * candidate for GC while the skb is not yet queued.
+        */
+       UNIXCB(skb).fp = scm_fp_dup(scm->fp);
+       if (!UNIXCB(skb).fp)
+               return -ENOMEM;
+
+       for (i = scm->fp->count - 1; i >= 0; i--)
+               unix_inflight(scm->fp->user, scm->fp->fp[i]);
+       return 0;
+}
+EXPORT_SYMBOL(unix_attach_fds);
+
+void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
+{
+       int i;
+
+       scm->fp = UNIXCB(skb).fp;
+       UNIXCB(skb).fp = NULL;
+
+       for (i = scm->fp->count-1; i >= 0; i--)
+               unix_notinflight(scm->fp->user, scm->fp->fp[i]);
+}
+EXPORT_SYMBOL(unix_detach_fds);
+
+void unix_destruct_scm(struct sk_buff *skb)
+{
+       struct scm_cookie scm;
+
+       memset(&scm, 0, sizeof(scm));
+       scm.pid  = UNIXCB(skb).pid;
+       if (UNIXCB(skb).fp)
+               unix_detach_fds(&scm, skb);
+
+       /* Alas, it calls VFS */
+       /* So fscking what? fput() had been SMP-safe since the last Summer */
+       scm_destroy(&scm);
+       sock_wfree(skb);
+}
+EXPORT_SYMBOL(unix_destruct_scm);
diff --git a/net/unix/scm.h b/net/unix/scm.h
new file mode 100644 (file)
index 0000000..5a255a4
--- /dev/null
@@ -0,0 +1,10 @@
+#ifndef NET_UNIX_SCM_H
+#define NET_UNIX_SCM_H
+
+extern struct list_head gc_inflight_list;
+extern spinlock_t unix_gc_lock;
+
+int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb);
+void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb);
+
+#endif