[<prev] [next>] [<thread-prev] [thread-next>] [day] [month] [year] [list]
Message-ID: <20100804022148.GA5922@localhost>
Date:	Wed, 4 Aug 2010 10:21:48 +0800
From:	Wu Fengguang <fengguang.wu@...el.com>
To:	Chris Webb <chris@...chsys.com>
Cc:	Minchan Kim <minchan.kim@...il.com>,
	"linux-mm@...ck.org" <linux-mm@...ck.org>,
	"linux-kernel@...r.kernel.org" <linux-kernel@...r.kernel.org>,
	KOSAKI Motohiro <kosaki.motohiro@...fujitsu.com>,
	Pekka Enberg <penberg@...helsinki.fi>
Subject: Re: Over-eager swapping
Chris,
Your slabinfo does contain many order 1-3 slab caches, this is a major source
of high order allocations and hence lumpy reclaim. fork() is another.
In another thread, Pekka Enberg offers a tip:
        You can pass "slub_debug=o" as a kernel parameter to disable higher
        order allocations if you want to test things.
Note that the parameter works on a CONFIG_SLUB_DEBUG=y kernel.
Thanks,
Fengguang
On Wed, Aug 04, 2010 at 05:49:46AM +0800, Chris Webb wrote:
> Wu Fengguang <fengguang.wu@...el.com> writes:
> 
> > Chris, what's in your /proc/slabinfo?
> 
> Hi. Sorry for the slow reply. The exact machine from which I previously
> extracted that /proc/memstat has unfortunately had swap turned off by a
> colleague while I was away, presumably because its behaviour because too
> bad. However, here is info from another member of the cluster, this time
> with 5GB of buffers and 2GB of swap in use, i.e. the same general problem:
> 
> # cat /proc/meminfo 
> MemTotal:       33084008 kB
> MemFree:         2291464 kB
> Buffers:         4908468 kB
> Cached:            16056 kB
> SwapCached:      1427480 kB
> Active:         22885508 kB
> Inactive:        5719520 kB
> Active(anon):   20466488 kB
> Inactive(anon):  3215888 kB
> Active(file):    2419020 kB
> Inactive(file):  2503632 kB
> Unevictable:       10688 kB
> Mlocked:           10688 kB
> SwapTotal:      25165816 kB
> SwapFree:       22798248 kB
> Dirty:              2616 kB
> Writeback:             0 kB
> AnonPages:      23410296 kB
> Mapped:             6324 kB
> Shmem:                56 kB
> Slab:             692296 kB
> SReclaimable:     189032 kB
> SUnreclaim:       503264 kB
> KernelStack:        4568 kB
> PageTables:        65588 kB
> NFS_Unstable:          0 kB
> Bounce:                0 kB
> WritebackTmp:          0 kB
> CommitLimit:    41707820 kB
> Committed_AS:   34859884 kB
> VmallocTotal:   34359738367 kB
> VmallocUsed:      147616 kB
> VmallocChunk:   34342399496 kB
> HardwareCorrupted:     0 kB
> HugePages_Total:       0
> HugePages_Free:        0
> HugePages_Rsvd:        0
> HugePages_Surp:        0
> Hugepagesize:       2048 kB
> DirectMap4k:        5888 kB
> DirectMap2M:     2156544 kB
> DirectMap1G:    31457280 kB
> 
> # cat /proc/slabinfo 
> slabinfo - version: 2.1
> # name            <active_objs> <num_objs> <objsize> <objperslab> <pagesperslab> : tunables <limit> <batchcount> <sharedfactor> : slabdata <active_slabs> <num_slabs> <sharedavail>
> kmalloc_dma-512       32     32    512   32    4 : tunables    0    0    0 : slabdata      1      1      0
> nf_conntrack_expect    312    312    208   39    2 : tunables    0    0    0 : slabdata      8      8      0
> nf_conntrack         240    240    272   30    2 : tunables    0    0    0 : slabdata      8      8      0
> dm_raid1_read_record      0      0   1064   30    8 : tunables    0    0    0 : slabdata      0      0      0
> dm_crypt_io          240    260    152   26    1 : tunables    0    0    0 : slabdata     10     10      0
> kcopyd_job             0      0    368   22    2 : tunables    0    0    0 : slabdata      0      0      0
> dm_uevent              0      0   2608   12    8 : tunables    0    0    0 : slabdata      0      0      0
> dm_rq_target_io        0      0    376   21    2 : tunables    0    0    0 : slabdata      0      0      0
> cfq_queue              0      0    168   24    1 : tunables    0    0    0 : slabdata      0      0      0
> bsg_cmd                0      0    312   26    2 : tunables    0    0    0 : slabdata      0      0      0
> mqueue_inode_cache     36     36    896   36    8 : tunables    0    0    0 : slabdata      1      1      0
> udf_inode_cache        0      0    640   25    4 : tunables    0    0    0 : slabdata      0      0      0
> fuse_request           0      0    632   25    4 : tunables    0    0    0 : slabdata      0      0      0
> fuse_inode             0      0    704   23    4 : tunables    0    0    0 : slabdata      0      0      0
> ntfs_big_inode_cache      0      0    832   39    8 : tunables    0    0    0 : slabdata      0      0      0
> ntfs_inode_cache       0      0    264   31    2 : tunables    0    0    0 : slabdata      0      0      0
> isofs_inode_cache      0      0    616   26    4 : tunables    0    0    0 : slabdata      0      0      0
> fat_inode_cache        0      0    648   25    4 : tunables    0    0    0 : slabdata      0      0      0
> fat_cache              0      0     40  102    1 : tunables    0    0    0 : slabdata      0      0      0
> hugetlbfs_inode_cache     28     28    584   28    4 : tunables    0    0    0 : slabdata      1      1      0
> squashfs_inode_cache      0      0    640   25    4 : tunables    0    0    0 : slabdata      0      0      0
> journal_handle      1360   1360     24  170    1 : tunables    0    0    0 : slabdata      8      8      0
> journal_head         288    288    112   36    1 : tunables    0    0    0 : slabdata      8      8      0
> revoke_table         512    512     16  256    1 : tunables    0    0    0 : slabdata      2      2      0
> revoke_record       1024   1024     32  128    1 : tunables    0    0    0 : slabdata      8      8      0
> ext4_inode_cache       0      0    896   36    8 : tunables    0    0    0 : slabdata      0      0      0
> ext4_free_block_extents      0      0     56   73    1 : tunables    0    0    0 : slabdata      0      0      0
> ext4_alloc_context      0      0    144   28    1 : tunables    0    0    0 : slabdata      0      0      0
> ext4_prealloc_space      0      0    104   39    1 : tunables    0    0    0 : slabdata      0      0      0
> ext4_system_zone       0      0     40  102    1 : tunables    0    0    0 : slabdata      0      0      0
> ext2_inode_cache       0      0    752   21    4 : tunables    0    0    0 : slabdata      0      0      0
> ext3_inode_cache    2371   2457    768   21    4 : tunables    0    0    0 : slabdata    117    117      0
> ext3_xattr             0      0     88   46    1 : tunables    0    0    0 : slabdata      0      0      0
> configfs_dir_cache      0      0     88   46    1 : tunables    0    0    0 : slabdata      0      0      0
> kioctx                 0      0    320   25    2 : tunables    0    0    0 : slabdata      0      0      0
> inotify_inode_mark_entry     36     36    112   36    1 : tunables    0    0    0 : slabdata      1      1      0
> posix_timers_cache    224    224    144   28    1 : tunables    0    0    0 : slabdata      8      8      0
> kvm_vcpu              38     45  10256    3    8 : tunables    0    0    0 : slabdata     15     15      0
> kvm_rmap_desc      19408  21828     40  102    1 : tunables    0    0    0 : slabdata    214    214      0
> kvm_pte_chain      14514  28543     56   73    1 : tunables    0    0    0 : slabdata    391    391      0
> UDP-Lite               0      0    768   21    4 : tunables    0    0    0 : slabdata      0      0      0
> ip_dst_cache         221    231    384   21    2 : tunables    0    0    0 : slabdata     11     11      0
> UDP                  168    168    768   21    4 : tunables    0    0    0 : slabdata      8      8      0
> tw_sock_TCP          256    256    256   32    2 : tunables    0    0    0 : slabdata      8      8      0
> TCP                  191    220   1472   22    8 : tunables    0    0    0 : slabdata     10     10      0
> blkdev_queue         178    210   2128   15    8 : tunables    0    0    0 : slabdata     14     14      0
> blkdev_requests      608    816    336   24    2 : tunables    0    0    0 : slabdata     34     34      0
> fsnotify_event         0      0    104   39    1 : tunables    0    0    0 : slabdata      0      0      0
> sock_inode_cache     250    300    640   25    4 : tunables    0    0    0 : slabdata     12     12      0
> file_lock_cache      176    176    184   22    1 : tunables    0    0    0 : slabdata      8      8      0
> shmem_inode_cache   1617   1827    776   21    4 : tunables    0    0    0 : slabdata     87     87      0
> Acpi-ParseExt       1692   1736     72   56    1 : tunables    0    0    0 : slabdata     31     31      0
> proc_inode_cache    1182   1326    616   26    4 : tunables    0    0    0 : slabdata     51     51      0
> sigqueue             200    200    160   25    1 : tunables    0    0    0 : slabdata      8      8      0
> radix_tree_node    65891  69542    560   29    4 : tunables    0    0    0 : slabdata   2398   2398      0
> bdev_cache           312    312    832   39    8 : tunables    0    0    0 : slabdata      8      8      0
> sysfs_dir_cache    21585  22287     80   51    1 : tunables    0    0    0 : slabdata    437    437      0
> inode_cache         2903   2996    568   28    4 : tunables    0    0    0 : slabdata    107    107      0
> dentry              8532   8631    192   21    1 : tunables    0    0    0 : slabdata    411    411      0
> buffer_head       1227688 1296648    112   36    1 : tunables    0    0    0 : slabdata  36018  36018      0
> vm_area_struct     18494  19389    176   23    1 : tunables    0    0    0 : slabdata    843    843      0
> files_cache          236    322    704   23    4 : tunables    0    0    0 : slabdata     14     14      0
> signal_cache         606    702    832   39    8 : tunables    0    0    0 : slabdata     18     18      0
> sighand_cache        415    480   2112   15    8 : tunables    0    0    0 : slabdata     32     32      0
> task_struct          671    840   1616   20    8 : tunables    0    0    0 : slabdata     42     42      0
> anon_vma            1511   1920     32  128    1 : tunables    0    0    0 : slabdata     15     15      0
> shared_policy_node    255    255     48   85    1 : tunables    0    0    0 : slabdata      3      3      0
> numa_policy        19205  20910     24  170    1 : tunables    0    0    0 : slabdata    123    123      0
> idr_layer_cache      373    390    544   30    4 : tunables    0    0    0 : slabdata     13     13      0
> kmalloc-8192          36     36   8192    4    8 : tunables    0    0    0 : slabdata      9      9      0
> kmalloc-4096        2284   2592   4096    8    8 : tunables    0    0    0 : slabdata    324    324      0
> kmalloc-2048         750    896   2048   16    8 : tunables    0    0    0 : slabdata     56     56      0
> kmalloc-1024        4025   4320   1024   32    8 : tunables    0    0    0 : slabdata    135    135      0
> kmalloc-512         1358   1760    512   32    4 : tunables    0    0    0 : slabdata     55     55      0
> kmalloc-256         1402   1952    256   32    2 : tunables    0    0    0 : slabdata     61     61      0
> kmalloc-128         8625   9280    128   32    1 : tunables    0    0    0 : slabdata    290    290      0
> kmalloc-64        7030122 7455232     64   64    1 : tunables    0    0    0 : slabdata 116488 116488      0
> kmalloc-32         18603  19712     32  128    1 : tunables    0    0    0 : slabdata    154    154      0
> kmalloc-16          8895   9728     16  256    1 : tunables    0    0    0 : slabdata     38     38      0
> kmalloc-8           9047  10752      8  512    1 : tunables    0    0    0 : slabdata     21     21      0
> kmalloc-192         5130   9135    192   21    1 : tunables    0    0    0 : slabdata    435    435      0
> kmalloc-96          1905   2940     96   42    1 : tunables    0    0    0 : slabdata     70     70      0
> kmem_cache_node      196    256     64   64    1 : tunables    0    0    0 : slabdata      4      4      0
> 
> # cat /proc/buddyinfo 
> Node 0, zone      DMA      2      0      2      2      2      2      2      1      2      2      2 
> Node 0, zone    DMA32  61877  10368    111     10      2      3      1      0      0      0      0 
> Node 0, zone   Normal   2036      0     14     12      6      3      3      0      1      0      0 
> Node 1, zone   Normal 483348     15      2      3      7      1      3      1      0      0      0 
>  
> Best wishes,
> 
> Chris.
--
To unsubscribe from this list: send the line "unsubscribe linux-kernel" in
the body of a message to majordomo@...r.kernel.org
More majordomo info at  http://vger.kernel.org/majordomo-info.html
Please read the FAQ at  http://www.tux.org/lkml/
Powered by blists - more mailing lists
 
