[<prev] [next>] [day] [month] [year] [list]
Message-ID: <20200227022830.GG6548@shao2-debian>
Date: Thu, 27 Feb 2020 10:28:30 +0800
From: kernel test robot <rong.a.chen@...el.com>
To: "Darrick J. Wong" <darrick.wong@...cle.com>
Cc: LKML <linux-kernel@...r.kernel.org>,
"Darrick J. Wong" <darrick.wong@...cle.com>, lkp@...ts.01.org
Subject: [xfs] 22d05173fc: filebench.sum_bytes_mb/s -47.5% regression
Greeting,
FYI, we noticed a -47.5% regression of filebench.sum_bytes_mb/s due to commit:
commit: 22d05173fcdcccc1560de717b4b0b02d25a9ca75 ("xfs: deferred inode inactivation")
https://git.kernel.org/cgit/linux/kernel/git/djwong/xfs-linux.git repair-hard-problems
in testcase: filebench
on test machine: 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory
with following parameters:
disk: 1HDD
fs: xfs
test: fileserver.f
cpufreq_governor: performance
ucode: 0x27
In addition to that, the commit also has significant impact on the following tests:
+------------------+------------------------------------------------------------------+
| testcase: change | filebench: filebench.sum_bytes_mb/s -67.7% regression |
| test machine | 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory |
| test parameters | cpufreq_governor=performance |
| | disk=1HDD |
| | fs=xfs |
| | test=webproxy.f |
| | ucode=0x27 |
+------------------+------------------------------------------------------------------+
If you fix the issue, kindly add following tag
Reported-by: kernel test robot <rong.a.chen@...el.com>
Details are as below:
-------------------------------------------------------------------------------------------------->
To reproduce:
git clone https://github.com/intel/lkp-tests.git
cd lkp-tests
bin/lkp install job.yaml # job file is attached in this email
bin/lkp run job.yaml
=========================================================================================
compiler/cpufreq_governor/disk/fs/kconfig/rootfs/tbox_group/test/testcase/ucode:
gcc-7/performance/1HDD/xfs/x86_64-rhel-7.6/debian-x86_64-20191114.cgz/lkp-hsw-d01/fileserver.f/filebench/0x27
commit:
1ef4da0e32 ("xfs: pass around xfs_inode_ag_walk iget/irele helper functions")
22d05173fc ("xfs: deferred inode inactivation")
1ef4da0e32ff780d 22d05173fcdcccc1560de717b4b
---------------- ---------------------------
%stddev %change %stddev
\ | \
160.20 -47.5% 84.05 ± 2% filebench.sum_bytes_mb/s
403786 -47.1% 213611 ± 2% filebench.sum_operations
6729 -47.1% 3559 ± 2% filebench.sum_operations/s
611.75 -47.1% 323.50 ± 2% filebench.sum_reads/s
7.39 +89.3% 14.00 ± 2% filebench.sum_time_ms/op
1223 -47.1% 647.50 ± 2% filebench.sum_writes/s
12115404 -39.2% 7366800 filebench.time.file_system_outputs
3948 ± 9% -35.6% 2544 ± 13% filebench.time.involuntary_context_switches
18.25 ± 2% -45.2% 10.00 filebench.time.percent_of_cpu_this_job_got
10.49 -45.6% 5.71 filebench.time.system_time
126690 -61.7% 48539 filebench.time.voluntary_context_switches
247153 -23.2% 189712 meminfo.Active(file)
2.36 ± 3% -0.8 1.57 mpstat.cpu.all.sys%
21.25 ± 2% +5.9% 22.50 ± 2% vmstat.cpu.wa
10401 ± 2% -10.3% 9333 vmstat.io.bo
33204 -5.3% 31452 vmstat.system.cs
284071 ± 46% -62.0% 107819 ± 18% cpuidle.C1.usage
1011674 ± 11% +13.0% 1143214 ± 9% cpuidle.C1E.usage
919405 ±123% -93.8% 57392 ± 8% cpuidle.POLL.time
296046 ±120% -92.7% 21599 ± 9% cpuidle.POLL.usage
546.75 ± 11% -54.5% 248.50 ± 2% interrupts.CPU0.RES:Rescheduling_interrupts
596.25 ± 4% -53.0% 280.00 ± 20% interrupts.CPU1.RES:Rescheduling_interrupts
540.75 ± 3% -34.1% 356.50 ± 16% interrupts.CPU7.RES:Rescheduling_interrupts
4673 ± 6% -30.8% 3233 ± 9% interrupts.RES:Rescheduling_interrupts
226.50 ± 3% -16.6% 189.00 turbostat.Avg_MHz
6.34 ± 3% -1.0 5.31 turbostat.Busy%
283487 ± 46% -62.2% 107234 ± 19% turbostat.C1
1011472 ± 11% +13.0% 1143059 ± 9% turbostat.C1E
21.74 +4.3% 22.68 iostat.cpu.iowait
2.43 ± 3% -32.9% 1.63 iostat.cpu.system
1.85 +1.7% 1.88 iostat.sda.avgqu-sz
99.47 ± 2% -4.8% 94.70 iostat.sda.w/s
10499 ± 2% -10.1% 9435 iostat.sda.wkB/s
11.90 ± 4% +26.3% 15.02 iostat.sda.wrqm/s
12931 ± 5% -9.8% 11659 ± 3% softirqs.CPU0.SCHED
11605 ± 8% -17.2% 9603 softirqs.CPU1.SCHED
12912 ± 4% -24.7% 9720 softirqs.CPU3.RCU
13604 ± 13% -25.3% 10161 ± 9% softirqs.CPU5.RCU
31877 ± 4% +8.2% 34483 ± 3% softirqs.CPU5.TIMER
13733 ± 24% -29.5% 9681 softirqs.CPU6.RCU
10669 ± 3% +8.7% 11602 softirqs.CPU7.SCHED
101349 ± 4% -13.4% 87749 softirqs.RCU
62061 ± 2% -23.0% 47813 proc-vmstat.nr_active_file
1514459 -39.2% 920832 proc-vmstat.nr_dirtied
235594 -5.8% 221816 proc-vmstat.nr_dirty
201158 +5.7% 212562 proc-vmstat.nr_inactive_file
15298 +4.1% 15918 proc-vmstat.nr_slab_reclaimable
11173 +6.6% 11912 proc-vmstat.nr_slab_unreclaimable
151300 ± 3% -13.4% 131050 proc-vmstat.nr_written
62053 ± 2% -23.0% 47804 proc-vmstat.nr_zone_active_file
201160 +5.7% 212569 proc-vmstat.nr_zone_inactive_file
235667 -5.9% 221873 proc-vmstat.nr_zone_write_pending
1636228 -36.4% 1039894 proc-vmstat.numa_hit
1636228 -36.4% 1039894 proc-vmstat.numa_local
310142 -48.1% 160887 ± 3% proc-vmstat.pgactivate
1769727 -33.1% 1183472 proc-vmstat.pgalloc_normal
117343 ± 2% +3.9% 121929 ± 2% proc-vmstat.pgfault
1542491 ± 9% -38.2% 953722 ± 23% proc-vmstat.pgfree
674632 ± 3% -10.7% 602501 proc-vmstat.pgpgout
1475 -19.2% 1191 sched_debug.cfs_rq:/.exec_clock.avg
2506 ± 4% -12.9% 2182 sched_debug.cfs_rq:/.exec_clock.max
997.85 ± 4% -27.5% 723.81 ± 3% sched_debug.cfs_rq:/.exec_clock.min
823218 ± 28% -45.7% 447205 ± 26% sched_debug.cfs_rq:/.load.max
5745 ± 10% +17.3% 6737 ± 5% sched_debug.cfs_rq:/.min_vruntime.stddev
127161 ± 16% -16.4% 106361 sched_debug.cfs_rq:/.runnable_weight.avg
698350 ± 24% -46.2% 375891 ± 31% sched_debug.cfs_rq:/.runnable_weight.max
238605 ± 23% -40.0% 143103 ± 22% sched_debug.cfs_rq:/.runnable_weight.stddev
5745 ± 10% +17.3% 6738 ± 5% sched_debug.cfs_rq:/.spread0.stddev
551.38 ± 3% +11.8% 616.19 ± 5% sched_debug.cfs_rq:/.util_avg.avg
320.88 ± 11% +40.0% 449.25 ± 8% sched_debug.cfs_rq:/.util_avg.min
346751 ± 3% -24.2% 262826 ± 21% sched_debug.cpu.avg_idle.stddev
22049 ± 17% +38.5% 30534 ± 21% sched_debug.cpu.nr_switches.stddev
178.00 ± 3% -13.1% 154.75 sched_debug.cpu.nr_uninterruptible.max
20430 ± 21% +39.8% 28562 ± 19% sched_debug.cpu.sched_count.stddev
10306 ± 21% +39.7% 14402 ± 18% sched_debug.cpu.sched_goidle.stddev
10073 ± 24% +38.9% 13988 ± 18% sched_debug.cpu.ttwu_count.stddev
74552 ± 2% +8.0% 80492 ± 5% sched_debug.cpu.ttwu_local.max
10234 ± 23% +37.8% 14107 ± 19% sched_debug.cpu.ttwu_local.stddev
1153 ± 3% +21.4% 1400 ± 9% slabinfo.kmalloc-128.active_objs
1153 ± 3% +26.5% 1459 ± 5% slabinfo.kmalloc-128.num_objs
1717 +10.6% 1899 ± 2% slabinfo.kmalloc-1k.active_objs
2209 ± 2% +17.5% 2597 slabinfo.kmalloc-1k.num_objs
1183 +9.6% 1297 slabinfo.kmalloc-2k.active_objs
1205 +14.0% 1374 slabinfo.kmalloc-2k.num_objs
262.00 +65.1% 432.50 ± 5% slabinfo.kmalloc-4k.active_objs
280.00 +81.8% 509.00 ± 2% slabinfo.kmalloc-4k.num_objs
4600 ± 3% +27.7% 5874 slabinfo.kmalloc-512.active_objs
6324 ± 3% +10.9% 7016 slabinfo.kmalloc-64.active_objs
6324 ± 3% +10.9% 7016 slabinfo.kmalloc-64.num_objs
1624 ± 3% +9.6% 1779 ± 3% slabinfo.kmalloc-96.active_objs
1624 ± 3% +9.6% 1779 ± 3% slabinfo.kmalloc-96.num_objs
630.00 ± 4% -23.3% 483.00 ± 4% slabinfo.kmalloc-rcl-96.active_objs
630.00 ± 4% -23.3% 483.00 ± 4% slabinfo.kmalloc-rcl-96.num_objs
8655 +27.6% 11041 slabinfo.skbuff_ext_cache.active_objs
412.00 +27.7% 526.00 ± 2% slabinfo.skbuff_ext_cache.active_slabs
8659 +27.6% 11052 ± 2% slabinfo.skbuff_ext_cache.num_objs
412.00 +27.7% 526.00 ± 2% slabinfo.skbuff_ext_cache.num_slabs
318.25 ± 12% +72.7% 549.50 slabinfo.xfs_efd_item.active_objs
318.25 ± 12% +88.2% 599.00 slabinfo.xfs_efd_item.num_objs
8583 +28.6% 11036 slabinfo.xfs_inode.active_objs
8602 +28.5% 11055 slabinfo.xfs_inode.num_objs
22.21 ± 5% -13.3% 19.27 ± 5% perf-stat.i.MPKI
2.496e+08 ± 3% -12.6% 2.181e+08 perf-stat.i.branch-instructions
2.39 ± 2% +0.1 2.52 ± 2% perf-stat.i.branch-miss-rate%
9930634 -4.5% 9487896 perf-stat.i.branch-misses
2415298 -31.6% 1651795 perf-stat.i.cache-misses
16700712 ± 2% -33.7% 11064760 ± 3% perf-stat.i.cache-references
34650 -5.3% 32814 perf-stat.i.context-switches
1.799e+09 ± 2% -17.7% 1.48e+09 perf-stat.i.cpu-cycles
1062 ± 2% -59.1% 434.58 perf-stat.i.cpu-migrations
781.36 ± 3% +8.9% 851.10 perf-stat.i.cycles-between-cache-misses
2.842e+08 ± 4% -15.3% 2.406e+08 ± 2% perf-stat.i.dTLB-loads
1.64e+08 ± 2% -15.4% 1.388e+08 ± 2% perf-stat.i.dTLB-stores
518395 ± 4% -20.5% 412050 ± 7% perf-stat.i.iTLB-loads
1.209e+09 ± 2% -13.2% 1.05e+09 perf-stat.i.instructions
1783955 -36.7% 1129530 ± 2% perf-stat.i.node-loads
257062 -35.6% 165448 perf-stat.i.node-stores
13.80 ± 3% -23.7% 10.53 ± 3% perf-stat.overall.MPKI
3.98 ± 2% +0.4 4.35 perf-stat.overall.branch-miss-rate%
14.47 +0.5 14.94 perf-stat.overall.cache-miss-rate%
1.49 -5.2% 1.41 perf-stat.overall.cpi
745.61 ± 2% +20.3% 897.18 perf-stat.overall.cycles-between-cache-misses
0.67 +5.5% 0.71 perf-stat.overall.ipc
2.461e+08 ± 3% -12.6% 2.15e+08 perf-stat.ps.branch-instructions
9797186 -4.5% 9358157 perf-stat.ps.branch-misses
2377698 -31.6% 1626092 perf-stat.ps.cache-misses
16439477 ± 2% -33.7% 10891402 ± 3% perf-stat.ps.cache-references
34107 -5.3% 32297 perf-stat.ps.context-switches
1.773e+09 ± 2% -17.7% 1.459e+09 perf-stat.ps.cpu-cycles
1046 ± 2% -59.1% 427.69 perf-stat.ps.cpu-migrations
2.801e+08 ± 4% -15.4% 2.371e+08 ± 2% perf-stat.ps.dTLB-loads
1.615e+08 ± 2% -15.4% 1.367e+08 ± 2% perf-stat.ps.dTLB-stores
510282 ± 4% -20.5% 405584 ± 7% perf-stat.ps.iTLB-loads
1.192e+09 ± 2% -13.2% 1.035e+09 perf-stat.ps.instructions
1756149 -36.7% 1112013 ± 2% perf-stat.ps.node-loads
253049 -35.6% 162873 perf-stat.ps.node-stores
7.694e+10 ± 2% -13.9% 6.629e+10 perf-stat.total.instructions
filebench.time.percent_of_cpu_this_job_got
20 +----------------------------------------------------------------------+
18 |-+ +.+ +.+.+ + + +.+ +.+ +.+ +.+ +.+.+ + ++.+.+.|
| : : : : : : : : : : : : : : : : : : |
16 |-+ : : : : : : : : : : : : : : : : : : |
14 |-+ : : : : : : : : : : : : : : : : : : |
| : : : : : : :: : : : : : : : : : : : : : |
12 |-+: : : : : : :: : : : : : : : : : : : : : |
10 |-O: : :O O : :O: ::O:O :O :O :O: : : O: : : : : : |
8 |-+: :: O:O: :O: :: : : :: O: :O :: : : : : |
| : :: : : : : :: : : :: : : :: : : : : |
6 |-+: :: : : : : :: : : :: : : :: : : : : |
4 |-: : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : |
2 |-: : : : : : : : : : : : : : |
0 +----------------------------------------------------------------------+
filebench.time.voluntary_context_switches
140000 +------------------------------------------------------------------+
| + +.++ + + +. +. +.+ +. ++.+ +.+ .+.|
120000 |-+ :+ : : : : : + : + : : : + : : + : + |
| :: : : : : : : : : : : : : : : : : |
100000 |-+ :: : : : : : : : : : : : : : : : : |
| : : : : : : :: : : : : : : : : : : : : |
80000 |-+: : : : : : :: : : : : : : : : : : :: : |
| : : : : : : :: : : : : : : : : : : :: : |
60000 |-+: : : : : :: : : : : :: : : : : : : : : |
| O: O:O:O OO:O:O:: :O:O : :O ::O O: :O O: :O : : : : |
40000 |-+: : : : : :: : : : : :: : : : : : : : : |
| : : : : : : : : : : : :: : : |
20000 |-: : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : |
0 +------------------------------------------------------------------+
filebench.time.file_system_outputs
1.4e+07 +-----------------------------------------------------------------+
| |
1.2e+07 |-++.+ ++.+ + + ++ ++ ++ ++ +.++ + +.+.++.|
| : : : : : : :: :: :: :: : : : : |
1e+07 |-+: : : : : : :: :: :: :: : : : : |
| : : : : : :: : : : : : : : : : : :: : |
8e+06 |-+: : :O : :: : : : :O :O : : : : : : : : : : |
| O: O:O: O O:O::O: :O:O : : :O:OO: :OO: :O : : : : |
6e+06 |-+: : : : : :: : : : : : : : : : : : : : : |
| : : : : : :: : : : : : : : : : : : : : : |
4e+06 |-: : : : : :: : : : : : : : : : : : : : : |
| : :: :: :: :: : : :: : : :: :: : : |
2e+06 |-: : : : : : : : : : : : :: |
| : : : : : : : : : : : : :: |
0 +-----------------------------------------------------------------+
filebench.sum_operations
450000 +------------------------------------------------------------------+
| + .++ + +. +. .+ +. +.+ +.+ .+.|
400000 |-+ :+ + : : + : + : + + : : + + : + : + |
350000 |-+ :: : : : : : : : : : : : : : : : : |
| :: : : : : : : : : : : : : : : : : |
300000 |-+: : : : : : :: : : : : : : : : : : : : |
250000 |-+: : : : : : :: : : : : : : : : : : :: : |
| O: O:O:O O :O:O:O:: :O :O :O : : : : : :O : :: : |
200000 |-+: : : O: : : ::O: : : :O: O: : O: : : : : : |
150000 |-+: : : : : :: : : : : :: : : : : : : : : |
| : : : : : :: : : : : :: : : : : : : : : |
100000 |-: :: : : : : : : : : :: :: : : |
50000 |-: : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : |
0 +------------------------------------------------------------------+
filebench.sum_operations_s
7000 +--------------------------------------------------------------------+
| ++ + : : + ++ +.+ + : ++ + + + : ++.+ |
6000 |-+ :: : : : : :: : : : : :: : : : : |
| :: : : : : :: : : : : :: : : : : |
5000 |-+ :: : : :: : :: : : : : :: : : : : |
| : : : : :: : : : : : : : : : : : : : : : |
4000 |-+: : : : :: : : : : : : : : : : : : : : : |
| O: O:O:O O O:O::O: :O:O :O :O :O: O: :OO: :O : : : : |
3000 |-+: : : :: : : : : : : :: : : : : :: : : |
| : : : :: : : : : : : :: : : : : :: : : |
2000 |-+: : : :: : : : : : : :: : : : : :: : : |
| : : : : : : : : : : : : : : |
1000 |-: : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : |
0 +--------------------------------------------------------------------+
filebench.sum_reads_s
700 +---------------------------------------------------------------------+
| .+ + |
600 |-+ +.+ +.+ : : + +.+ +.+ +.+ +.+ +.++ + ++.+.+.|
| : : : : : : : : : : : : : : : : : : |
500 |-+ : : : : : : : : : : : : : : : : : : |
| : : : : :: :: : : : : : : : : : : :: : |
400 |-+: : : : :: : : : : : : : : : : : : : : : |
| : : :O O : :: : : :O :O :O : : : : : :O : : : : |
300 |-O: O:: O:O: :: :O: : : :O:O O: :O O: : : : : : |
| : :: : : :: : : : : : : : : : : : : : : |
200 |-+: :: : : :: : : : : : : : : : : : : : : |
| : :: : :: :: : : :: : : :: :: : : |
100 |-: : : : : :: : :: : : : : |
| : : : : : :: : :: : : : : |
0 +---------------------------------------------------------------------+
filebench.sum_writes_s
1400 +--------------------------------------------------------------------+
| .+ + |
1200 |-+ ++ +.+ : : + ++ +.+ +.+ ++ +.+.+ + +.++.+.|
| :: : : : : :: : : : : :: : : : : |
1000 |-+ :: : : : : :: : : : : :: : : : : |
| : : : : :: :: : : : : : : : : : : :: : |
800 |-+: : : : :: : : : : : : : : : : : : : : : |
| : : :O O : :: : : :O :O :O : : : : : :O : : : : |
600 |-O: O:O: O:: :O: :O: : : :O: O: :OO: : :: : : |
| : : : :: : : : : : : :: : : : : :: : : |
400 |-+: : : :: : : : : : : :: : : : : :: : : |
| : :: : :: :: : : : : : :: :: : : |
200 |-: : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : |
0 +--------------------------------------------------------------------+
filebench.sum_bytes_mb_s
180 +---------------------------------------------------------------------+
| .+.+ + +. .+ .+ + .|
160 |-+ +.+ + : : + : + +.+ + : +.+ + + + :+.+.+ |
140 |-+ : : : : : : : : : : : : : : : : : : |
| : : : : : : : : : : : : : : : : : : |
120 |-+ : : : : :: :: : : : : : : : : : : :: : |
100 |-+: : : : :: : : : : : : : : : : : : : : : |
| : : :O O : :: : : :O :O :O : : : : : :O : : : : |
80 |-O: O:: O:O: :: :O: : : :O:O O: :O O: : : : : : |
60 |-+: :: : : :: : : : : : : : : : : : : : : |
| : :: : : :: : : : : : : : : : : : : : : |
40 |-+: :: : :: : : : :: : : :: :: : : |
20 |-: : : : : :: : :: : : : : |
| : : : : : :: : :: : : : : |
0 +---------------------------------------------------------------------+
filebench.sum_time_ms_op
16 +----------------------------------------------------------------------+
| O O O O O O O |
14 |-O OO O O O O O O O O O |
12 |-+ |
| |
10 |-+ |
| |
8 |-+ .+ +. + .+ .+ +. .+ +. + .+.+.|
| + : : +.+ + : + : + : : + + : : +.+ : ++ |
6 |-+ : : : : : :: : : : : : : : : : : : : : |
4 |-+: : : : : : :: : : : : : : : : : : : : : |
| : :: : : : : :: : : :: : : :: : : : : |
2 |-+: :: : : : : :: : : :: : : :: : : : : |
| : : : : : : : : : : : : : : |
0 +----------------------------------------------------------------------+
[*] bisect-good sample
[O] bisect-bad sample
***************************************************************************************************
lkp-hsw-d01: 8 threads Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz with 8G memory
=========================================================================================
compiler/cpufreq_governor/disk/fs/kconfig/rootfs/tbox_group/test/testcase/ucode:
gcc-7/performance/1HDD/xfs/x86_64-rhel-7.6/debian-x86_64-20191114.cgz/lkp-hsw-d01/webproxy.f/filebench/0x27
commit:
1ef4da0e32 ("xfs: pass around xfs_inode_ag_walk iget/irele helper functions")
22d05173fc ("xfs: deferred inode inactivation")
1ef4da0e32ff780d 22d05173fcdcccc1560de717b4b
---------------- ---------------------------
fail:runs %reproduction fail:runs
| | |
1:4 -25% :4 kmsg.snd_hda_intel#:#:#:HSW/BDW_HD-audio_HDMI/DP_requires_binding_with_gfx_driver
%stddev %change %stddev
\ | \
220.53 ± 3% -67.7% 71.13 ± 3% filebench.sum_bytes_mb/s
5234961 ± 3% -69.4% 1603647 ± 3% filebench.sum_operations
87244 ± 3% -69.4% 26724 ± 3% filebench.sum_operations/s
22958 ± 3% -69.4% 7032 ± 3% filebench.sum_reads/s
1.14 ± 3% +223.2% 3.70 ± 3% filebench.sum_time_ms/op
4591 ± 3% -69.4% 1406 ± 3% filebench.sum_writes/s
5767261 ± 2% -66.3% 1941944 ± 3% filebench.time.file_system_outputs
541.67 ± 5% +180.2% 1517 ± 3% filebench.time.involuntary_context_switches
128.67 ± 2% -61.7% 49.33 ± 11% filebench.time.percent_of_cpu_this_job_got
72.98 ± 2% -56.0% 32.10 ± 4% filebench.time.system_time
918981 ± 2% -82.3% 162595 ± 8% filebench.time.voluntary_context_switches
30009458 ± 20% -49.3% 15224931 ± 44% cpuidle.C1.time
1.3e+08 ± 7% -41.8% 75606650 ± 25% cpuidle.C1E.time
1704699 ± 5% -37.5% 1065467 ± 15% cpuidle.C1E.usage
5.80 +5.2 10.97 ± 3% mpstat.cpu.all.iowait%
0.03 ± 31% +0.0 0.04 ± 17% mpstat.cpu.all.soft%
14.48 ± 3% -7.9 6.55 ± 10% mpstat.cpu.all.sys%
2.95 -1.3 1.60 ± 7% mpstat.cpu.all.usr%
76.67 +4.8% 80.33 vmstat.cpu.id
5.00 +113.3% 10.67 ± 4% vmstat.cpu.wa
2232 +65.0% 3683 ± 4% vmstat.io.bo
57533 -43.4% 32567 ± 5% vmstat.system.cs
28797 -9.1% 26174 ± 6% vmstat.system.in
77.23 +4.9% 81.02 iostat.cpu.idle
5.64 +91.7% 10.82 ± 3% iostat.cpu.iowait
14.15 ± 3% -54.2% 6.48 ± 10% iostat.cpu.system
2.98 -43.6% 1.68 ± 7% iostat.cpu.user
0.97 ± 2% +75.1% 1.70 iostat.sda.avgqu-sz
59.95 +64.2% 98.45 iostat.sda.w/s
2330 +62.0% 3775 ± 4% iostat.sda.wkB/s
23.83 ± 5% +104.6% 48.75 ± 28% iostat.sda.wrqm/s
683.67 ± 2% -46.6% 365.33 ± 8% turbostat.Avg_MHz
19.60 ± 2% -9.4 10.17 ± 7% turbostat.Busy%
5.83 ± 20% -3.2 2.64 ± 41% turbostat.C1%
1704492 ± 5% -37.5% 1065307 ± 15% turbostat.C1E
25.27 ± 7% -11.8 13.49 ± 33% turbostat.C1E%
43.92 ± 2% -31.0% 30.30 ± 16% turbostat.CPU%c1
14.06 ± 2% -46.0% 7.59 ± 6% turbostat.CorWatt
2.73 ± 10% +289.6% 10.62 ± 52% turbostat.Pkg%pc2
43.33 ± 2% -8.5% 39.67 ± 3% turbostat.PkgTmp
23.38 -28.2% 16.78 ± 5% turbostat.PkgWatt
1277941 -7.6% 1180539 ± 5% meminfo.Active
1219006 -7.7% 1125199 ± 5% meminfo.Active(anon)
987534 -7.9% 909405 ± 5% meminfo.AnonHugePages
1217898 -7.7% 1124115 ± 5% meminfo.AnonPages
1539544 -7.6% 1422961 ± 5% meminfo.Committed_AS
77430 -8.7% 70692 ± 5% meminfo.Dirty
52261 -7.6% 48276 ± 5% meminfo.Inactive(anon)
59050 +24.6% 73569 meminfo.KReclaimable
59050 +24.6% 73569 meminfo.SReclaimable
46030 +41.9% 65297 meminfo.SUnreclaim
53507 -7.4% 49572 ± 5% meminfo.Shmem
105080 +32.2% 138866 meminfo.Slab
7922 +75.8% 13923 ± 7% interrupts.19:IR-IO-APIC.19-fasteoi.ata_piix
8665 ± 65% -93.5% 565.33 ± 22% interrupts.28:IR-PCI-MSI.409600-edge.eth0
228064 ± 6% +18.6% 270405 ± 5% interrupts.CPU1.LOC:Local_timer_interrupts
1693 ± 7% -74.6% 430.67 ± 21% interrupts.CPU1.RES:Rescheduling_interrupts
1688 ± 7% -71.2% 486.33 ± 11% interrupts.CPU2.RES:Rescheduling_interrupts
225190 ± 6% -15.5% 190223 ± 7% interrupts.CPU3.LOC:Local_timer_interrupts
1677 ± 5% -68.4% 529.67 ± 9% interrupts.CPU3.RES:Rescheduling_interrupts
8665 ± 65% -93.5% 565.33 ± 22% interrupts.CPU4.28:IR-PCI-MSI.409600-edge.eth0
1874 ± 6% -78.7% 399.33 ± 22% interrupts.CPU4.RES:Rescheduling_interrupts
2582 ±141% +439.1% 13923 ± 7% interrupts.CPU6.19:IR-IO-APIC.19-fasteoi.ata_piix
121.00 ± 6% -8.8% 110.33 ± 2% interrupts.CPU6.CAL:Function_call_interrupts
1612 ± 3% -79.1% 337.33 ± 12% interrupts.CPU6.RES:Rescheduling_interrupts
1636 ± 3% -70.5% 483.00 ± 20% interrupts.CPU7.RES:Rescheduling_interrupts
13397 ± 3% -56.3% 5854 ± 13% interrupts.RES:Rescheduling_interrupts
37218 ± 20% -57.8% 15693 ± 3% softirqs.CPU0.RCU
15232 ± 11% -19.1% 12320 softirqs.CPU0.SCHED
38659 ± 21% -56.7% 16757 ± 15% softirqs.CPU1.RCU
12250 ± 9% +11.6% 13670 ± 3% softirqs.CPU1.SCHED
39022 ± 22% -55.7% 17302 ± 12% softirqs.CPU2.RCU
36960 ± 20% -50.4% 18342 ± 15% softirqs.CPU3.RCU
45511 ± 26% -68.0% 14565 ± 5% softirqs.CPU4.RCU
14445 ± 13% -23.9% 10986 ± 8% softirqs.CPU4.SCHED
37848 ± 14% -22.8% 29212 ± 3% softirqs.CPU4.TIMER
36155 ± 20% -57.9% 15227 softirqs.CPU5.RCU
27973 ± 2% +25.6% 35126 ± 6% softirqs.CPU5.TIMER
42201 ± 17% -65.8% 14431 ± 6% softirqs.CPU6.RCU
37116 ± 20% -58.3% 15468 ± 4% softirqs.CPU7.RCU
312846 ± 21% -59.2% 127790 ± 3% softirqs.RCU
304801 -7.4% 282277 ± 5% proc-vmstat.nr_active_anon
14706 -5.7% 13875 ± 4% proc-vmstat.nr_active_file
304523 -7.4% 282004 ± 5% proc-vmstat.nr_anon_pages
481.67 -7.5% 445.33 ± 5% proc-vmstat.nr_anon_transparent_hugepages
720938 ± 2% -66.3% 242773 ± 3% proc-vmstat.nr_dirtied
19357 -8.3% 17742 ± 5% proc-vmstat.nr_dirty
14762 +24.6% 18392 proc-vmstat.nr_slab_reclaimable
11506 +41.7% 16310 proc-vmstat.nr_slab_unreclaimable
4609 ± 9% +142.7% 11185 ± 27% proc-vmstat.nr_written
304803 -7.4% 282279 ± 5% proc-vmstat.nr_zone_active_anon
14707 -5.7% 13873 ± 4% proc-vmstat.nr_zone_active_file
19357 -8.3% 17742 ± 5% proc-vmstat.nr_zone_write_pending
861354 ± 2% -53.6% 399352 ± 3% proc-vmstat.numa_hit
861354 ± 2% -53.6% 399352 ± 3% proc-vmstat.numa_local
497744 ± 2% -66.9% 164797 ± 3% proc-vmstat.pgactivate
1122497 -39.2% 682223 ± 2% proc-vmstat.pgalloc_normal
133031 ± 3% +5.0% 139706 ± 3% proc-vmstat.pgfault
1103704 -40.9% 652470 ± 2% proc-vmstat.pgfree
146393 +81.2% 265334 ± 10% proc-vmstat.pgpgout
450.33 +94.1% 874.00 slabinfo.intel_context.active_objs
450.33 +97.4% 889.00 slabinfo.intel_context.num_objs
21075 ± 5% +40.6% 29626 ± 5% slabinfo.kmalloc-16.active_objs
21075 ± 5% +102.3% 42635 slabinfo.kmalloc-16.num_objs
1289 ± 9% +42.1% 1832 ± 5% slabinfo.kmalloc-1k.active_objs
1448 ± 8% +61.4% 2338 ± 13% slabinfo.kmalloc-1k.num_objs
1097 ± 3% +20.8% 1325 ± 4% slabinfo.kmalloc-2k.active_objs
1113 ± 2% +22.2% 1360 ± 4% slabinfo.kmalloc-2k.num_objs
209.67 +105.1% 430.00 ± 2% slabinfo.kmalloc-4k.active_objs
219.33 ± 2% +116.3% 474.33 ± 3% slabinfo.kmalloc-4k.num_objs
8972 ± 2% +110.3% 18870 ± 5% slabinfo.kmalloc-512.active_objs
397.33 +97.7% 785.67 ± 7% slabinfo.kmalloc-512.active_slabs
12730 +97.7% 25165 ± 7% slabinfo.kmalloc-512.num_objs
397.33 +97.7% 785.67 ± 7% slabinfo.kmalloc-512.num_slabs
200.67 +389.2% 981.67 ± 3% slabinfo.kmalloc-8k.active_objs
50.67 +427.6% 267.33 ± 2% slabinfo.kmalloc-8k.active_slabs
204.00 +424.8% 1070 ± 2% slabinfo.kmalloc-8k.num_objs
50.67 +427.6% 267.33 ± 2% slabinfo.kmalloc-8k.num_slabs
421.00 ± 7% +48.6% 625.67 ± 11% slabinfo.pool_workqueue.active_objs
8065 +166.4% 21484 slabinfo.skbuff_ext_cache.active_objs
383.67 +173.7% 1050 slabinfo.skbuff_ext_cache.active_slabs
8065 +173.6% 22065 slabinfo.skbuff_ext_cache.num_objs
383.67 +173.7% 1050 slabinfo.skbuff_ext_cache.num_slabs
549.00 ± 2% +59.8% 877.33 slabinfo.xfs_buf_item.active_objs
589.67 +61.7% 953.67 ± 2% slabinfo.xfs_buf_item.num_objs
7821 +173.4% 21381 slabinfo.xfs_inode.active_objs
243.67 +183.2% 690.00 slabinfo.xfs_inode.active_slabs
7821 +182.4% 22088 slabinfo.xfs_inode.num_objs
243.67 +183.2% 690.00 slabinfo.xfs_inode.num_slabs
5669 ± 2% -46.8% 3018 ± 3% sched_debug.cfs_rq:/.exec_clock.avg
6627 ± 5% -44.2% 3697 ± 4% sched_debug.cfs_rq:/.exec_clock.max
5087 ± 2% -50.8% 2501 ± 4% sched_debug.cfs_rq:/.exec_clock.min
135621 ± 15% +41.9% 192447 ± 13% sched_debug.cfs_rq:/.load.avg
729.31 ± 10% +29.0% 940.75 ± 13% sched_debug.cfs_rq:/.load_avg.avg
26.83 ± 55% -55.3% 12.00 ± 10% sched_debug.cfs_rq:/.load_avg.min
28620 ± 3% -18.5% 23318 sched_debug.cfs_rq:/.min_vruntime.avg
38368 ± 2% -13.2% 33315 ± 2% sched_debug.cfs_rq:/.min_vruntime.max
21593 ± 6% -26.6% 15847 ± 4% sched_debug.cfs_rq:/.min_vruntime.min
58.27 ± 11% +44.5% 84.23 ± 3% sched_debug.cfs_rq:/.runnable_load_avg.avg
253.17 ± 37% +80.6% 457.17 ± 26% sched_debug.cfs_rq:/.runnable_load_avg.max
78.89 ± 39% +91.7% 151.23 ± 23% sched_debug.cfs_rq:/.runnable_load_avg.stddev
104396 ± 17% +47.3% 153799 ± 15% sched_debug.cfs_rq:/.runnable_weight.avg
1214 ±323% -560.0% -5584 sched_debug.cfs_rq:/.spread0.avg
10960 ± 34% -59.7% 4419 ± 62% sched_debug.cfs_rq:/.spread0.max
-5813 +124.6% -13055 sched_debug.cfs_rq:/.spread0.min
512.33 ± 13% -26.3% 377.50 ± 8% sched_debug.cfs_rq:/.util_avg.min
570654 +49.9% 855390 ± 23% sched_debug.cpu.avg_idle.max
238825 -36.8% 150911 ± 2% sched_debug.cpu.nr_switches.avg
212251 -55.9% 93574 ± 6% sched_debug.cpu.nr_switches.min
20271 ± 11% +189.3% 58649 ± 8% sched_debug.cpu.nr_switches.stddev
26.83 ± 28% +107.5% 55.67 ± 18% sched_debug.cpu.nr_uninterruptible.max
-14.83 +86.5% -27.67 sched_debug.cpu.nr_uninterruptible.min
12.83 ± 25% +99.4% 25.57 ± 13% sched_debug.cpu.nr_uninterruptible.stddev
231363 -37.7% 144046 ± 2% sched_debug.cpu.sched_count.avg
208314 -57.6% 88228 ± 6% sched_debug.cpu.sched_count.min
17715 ± 15% +224.7% 57525 ± 10% sched_debug.cpu.sched_count.stddev
115029 -38.5% 70798 ± 2% sched_debug.cpu.sched_goidle.avg
103568 -57.8% 43658 ± 7% sched_debug.cpu.sched_goidle.min
8858 ± 15% +206.1% 27114 ± 8% sched_debug.cpu.sched_goidle.stddev
128312 -43.3% 72796 ± 2% sched_debug.cpu.ttwu_count.avg
116741 -62.3% 44015 ± 9% sched_debug.cpu.ttwu_count.min
8708 ± 11% +233.6% 29047 ± 10% sched_debug.cpu.ttwu_count.stddev
71598 ± 3% +43.4% 102690 ± 10% sched_debug.cpu.ttwu_local.max
43212 ± 3% -29.2% 30589 ± 10% sched_debug.cpu.ttwu_local.min
9247 ± 18% +153.3% 23425 ± 5% sched_debug.cpu.ttwu_local.stddev
1.044e+09 ± 2% -57.9% 4.401e+08 ± 7% perf-stat.i.branch-instructions
1.42 +0.5 1.89 ± 13% perf-stat.i.branch-miss-rate%
17681401 -43.2% 10036731 ± 8% perf-stat.i.branch-misses
7.03 ± 2% +1.9 8.89 ± 2% perf-stat.i.cache-miss-rate%
4759033 ± 4% -59.7% 1918035 ± 3% perf-stat.i.cache-misses
70368951 ± 3% -69.2% 21652549 ± 2% perf-stat.i.cache-references
60146 -43.6% 33924 ± 5% perf-stat.i.context-switches
1.08 +54.7% 1.68 ± 2% perf-stat.i.cpi
5.468e+09 ± 2% -46.0% 2.951e+09 ± 7% perf-stat.i.cpu-cycles
2036 ± 2% -88.8% 229.03 ± 5% perf-stat.i.cpu-migrations
1179 ± 3% +29.4% 1526 ± 8% perf-stat.i.cycles-between-cache-misses
0.14 ± 10% +0.1 0.21 ± 16% perf-stat.i.dTLB-load-miss-rate%
1790400 ± 13% -65.1% 625279 ± 4% perf-stat.i.dTLB-load-misses
1.338e+09 ± 2% -58.1% 5.612e+08 ± 9% perf-stat.i.dTLB-loads
0.05 ± 4% +0.0 0.07 ± 5% perf-stat.i.dTLB-store-miss-rate%
291442 ± 7% -56.8% 125839 ± 3% perf-stat.i.dTLB-store-misses
5.897e+08 ± 3% -63.0% 2.181e+08 ± 4% perf-stat.i.dTLB-stores
989867 ± 10% -63.3% 363230 ± 2% perf-stat.i.iTLB-load-misses
1704951 ± 2% -61.7% 653048 ± 6% perf-stat.i.iTLB-loads
5.117e+09 ± 2% -57.5% 2.177e+09 ± 7% perf-stat.i.instructions
0.93 -30.2% 0.65 perf-stat.i.ipc
3838963 ± 4% -65.4% 1326517 ± 4% perf-stat.i.node-loads
559056 ± 3% -62.4% 210435 ± 3% perf-stat.i.node-stores
13.75 -27.4% 9.98 ± 5% perf-stat.overall.MPKI
1.70 ± 2% +0.6 2.28 ± 2% perf-stat.overall.branch-miss-rate%
6.76 ± 2% +2.1 8.86 perf-stat.overall.cache-miss-rate%
1.07 +26.8% 1.36 perf-stat.overall.cpi
1151 ± 3% +33.6% 1537 ± 4% perf-stat.overall.cycles-between-cache-misses
0.05 ± 4% +0.0 0.06 ± 6% perf-stat.overall.dTLB-store-miss-rate%
5215 ± 8% +15.0% 5999 ± 7% perf-stat.overall.instructions-per-iTLB-miss
0.94 -21.2% 0.74 perf-stat.overall.ipc
1.028e+09 ± 2% -57.8% 4.344e+08 ± 7% perf-stat.ps.branch-instructions
17423573 -43.0% 9924230 ± 8% perf-stat.ps.branch-misses
4683939 ± 4% -59.6% 1890940 ± 3% perf-stat.ps.cache-misses
69252966 ± 3% -69.2% 21340939 ± 2% perf-stat.ps.cache-references
59194 -43.5% 33432 ± 5% perf-stat.ps.context-switches
5.383e+09 ± 2% -45.9% 2.912e+09 ± 7% perf-stat.ps.cpu-cycles
2003 ± 2% -88.7% 225.68 ± 5% perf-stat.ps.cpu-migrations
1762081 ± 13% -65.0% 616342 ± 4% perf-stat.ps.dTLB-load-misses
1.317e+09 ± 2% -58.0% 5.536e+08 ± 9% perf-stat.ps.dTLB-loads
286859 ± 7% -56.7% 124083 ± 3% perf-stat.ps.dTLB-store-misses
5.805e+08 ± 3% -62.9% 2.151e+08 ± 4% perf-stat.ps.dTLB-stores
974196 ± 10% -63.2% 358026 ± 2% perf-stat.ps.iTLB-load-misses
1677930 ± 2% -61.6% 643616 ± 6% perf-stat.ps.iTLB-loads
5.037e+09 ± 2% -57.3% 2.149e+09 ± 7% perf-stat.ps.instructions
3778335 ± 4% -65.4% 1307677 ± 4% perf-stat.ps.node-loads
550210 ± 3% -62.3% 207414 ± 3% perf-stat.ps.node-stores
3.226e+11 ± 2% -52.9% 1.52e+11 ± 3% perf-stat.total.instructions
Disclaimer:
Results have been estimated based on internal Intel analysis and are provided
for informational purposes only. Any difference in system hardware or software
design or configuration may affect actual performance.
Thanks,
Rong Chen
View attachment "config-5.6.0-rc2-00073-g22d05173fcdcc" of type "text/plain" (203594 bytes)
View attachment "job-script" of type "text/plain" (7892 bytes)
View attachment "job.yaml" of type "text/plain" (5483 bytes)
View attachment "reproduce" of type "text/plain" (465 bytes)
Powered by blists - more mailing lists