block: Unhash block device inodes on gendisk destruction
authorJan Kara <jack@suse.cz>
Thu, 2 Feb 2017 14:56:49 +0000 (15:56 +0100)
committerJens Axboe <axboe@fb.com>
Thu, 2 Feb 2017 15:18:41 +0000 (08:18 -0700)
Currently, block device inodes stay around after corresponding gendisk
hash died until memory reclaim finds them and frees them. Since we will
make block device inode pin the bdi, we want to free the block device
inode as soon as the device goes away so that bdi does not stay around
unnecessarily. Furthermore we need to avoid issues when new device with
the same major,minor pair gets created since reusing the bdi structure
would be rather difficult in this case.

Unhashing block device inode on gendisk destruction nicely deals with
these problems. Once last block device inode reference is dropped (which
may be directly in del_gendisk()), the inode gets evicted. Furthermore if
the major,minor pair gets reallocated, we are guaranteed to get new
block device inode even if old block device inode is not yet evicted and
thus we avoid issues with possible reuse of bdi.

Reviewed-by: Christoph Hellwig <hch@lst.de>
Signed-off-by: Jan Kara <jack@suse.cz>
Signed-off-by: Jens Axboe <axboe@fb.com>
block/genhd.c
fs/block_dev.c
include/linux/fs.h

index fcd6d4fae657cfdf118274cec31780f9e8b8c1f8..f2f22d0e8e1432142d282bb21fa3ad6b864c714e 100644 (file)
@@ -648,6 +648,8 @@ void del_gendisk(struct gendisk *disk)
        disk_part_iter_init(&piter, disk,
                             DISK_PITER_INCL_EMPTY | DISK_PITER_REVERSE);
        while ((part = disk_part_iter_next(&piter))) {
+               bdev_unhash_inode(MKDEV(disk->major,
+                                       disk->first_minor + part->partno));
                invalidate_partition(disk, part->partno);
                delete_partition(disk, part->partno);
        }
index 5db5d1340d69eccf475f0feac7f85665bd6aceb5..ed6a34be7a1ef8d00f3c97c9ffb61eee51d1ed3d 100644 (file)
@@ -954,6 +954,21 @@ static int bdev_set(struct inode *inode, void *data)
 
 static LIST_HEAD(all_bdevs);
 
+/*
+ * If there is a bdev inode for this device, unhash it so that it gets evicted
+ * as soon as last inode reference is dropped.
+ */
+void bdev_unhash_inode(dev_t dev)
+{
+       struct inode *inode;
+
+       inode = ilookup5(blockdev_superblock, hash(dev), bdev_test, &dev);
+       if (inode) {
+               remove_inode_hash(inode);
+               iput(inode);
+       }
+}
+
 struct block_device *bdget(dev_t dev)
 {
        struct block_device *bdev;
index 2ba074328894cea30d6273a574417d789fae271d..702cb6c5019413c61eb889938c39bc0fde1f51aa 100644 (file)
@@ -2342,6 +2342,7 @@ extern struct kmem_cache *names_cachep;
 #ifdef CONFIG_BLOCK
 extern int register_blkdev(unsigned int, const char *);
 extern void unregister_blkdev(unsigned int, const char *);
+extern void bdev_unhash_inode(dev_t dev);
 extern struct block_device *bdget(dev_t);
 extern struct block_device *bdgrab(struct block_device *bdev);
 extern void bd_set_size(struct block_device *, loff_t size);