[<prev] [next>] [<thread-prev] [day] [month] [year] [list]
Message-ID: <20170607021229.GJ2969@yexl-desktop>
Date: Wed, 7 Jun 2017 10:12:29 +0800
From: kernel test robot <xiaolong.ye@...el.com>
To: Paolo Abeni <pabeni@...hat.com>
Cc: netdev@...r.kernel.org, "David S. Miller" <davem@...emloft.net>,
Eric Dumazet <edumazet@...gle.com>, lkp@...org
Subject: [lkp-robot] [udp] bc0d3d0639: apachebench.requests_per_second -21%
regression
Greeting,
FYI, we noticed a -21% regression of apachebench.requests_per_second due to commit:
commit: bc0d3d0639a29546708657c1666a474c0af19316 ("udp: try to avoid 2 cache miss on dequeue")
url: https://github.com/0day-ci/linux/commits/Paolo-Abeni/udp-reduce-cache-pressure/20170529-234944
in testcase: apachebench
on test machine: 16 threads Intel(R) Atom(R) CPU 3958 @ 2.00GHz with 64G memory
with following parameters:
runtime: 300s
concurrency: 1000
cluster: cs-localhost
cpufreq_governor: performance
test-description: apachebench is a tool for benchmarking your Apache Hypertext Transfer Protocol (HTTP) server.
test-url: https://httpd.apache.org/docs/2.4/programs/ab.html
Details are as below:
-------------------------------------------------------------------------------------------------->
To reproduce:
git clone https://github.com/01org/lkp-tests.git
cd lkp-tests
bin/lkp install job.yaml # job file is attached in this email
bin/lkp run job.yaml
testcase/path_params/tbox_group/run: apachebench/300s-1000-cs-localhost-performance/lkp-denverton2
85f4454bfd01c363 bc0d3d0639a29546708657c166
---------------- --------------------------
%stddev change %stddev
\ | \
62.90 26% 79.18 apachebench.time_per_request
15899 -21% 12628 apachebench.requests_per_second
170764 -21% 135638 apachebench.transfer_rate
60098 23% 74166 apachebench.connection_time.total.max
60098 23% 74166 apachebench.max_latency.100%
64.91 56% 101.13 apachebench.time.elapsed_time
64.91 56% 101.13 apachebench.time.elapsed_time.max
69 -37% 43 apachebench.time.percent_of_cpu_this_job_got
41225 20% 49376 interrupts.CAL:Function_call_interrupts
570 -33% 381 turbostat.Avg_MHz
28.59 -33% 19.07 turbostat.%Busy
75381 -43% 42629 vmstat.system.in
142204 -52% 67789 vmstat.system.cs
13095 ± 26% 9e+05 960405 ±171% latency_stats.avg.max
13095 ± 26% 1e+06 994807 ±171% latency_stats.max.max
13879 ± 67% -8e+03 6306 ± 19% latency_stats.sum.ep_poll.SyS_epoll_wait.do_syscall_64.return_from_SYSCALL_64
9834 ± 63% -1e+04 0 latency_stats.sum.vm_unmap_aliases.change_page_attr_set_clr.set_memory_ro.bpf_prog_select_runtime.bpf_prepare_filter.bpf_prog_create_from_user.do_seccomp.prctl_set_seccomp.SyS_prctl.entry_SYSCALL_64_fastpath
7.43 ± 4% 11% 8.23 ± 3% perf-stat.branch-miss-rate%
3.309e+09 3% 3.413e+09 perf-stat.branch-misses
1224211 3% 1261383 perf-stat.page-faults
1224211 3% 1261382 perf-stat.minor-faults
2.258e+11 ± 4% -7% 2.111e+11 perf-stat.instructions
4.463e+10 ± 5% -7% 4.148e+10 perf-stat.branch-instructions
0.36 -8% 0.33 perf-stat.ipc
9533387 -26% 7020637 perf-stat.context-switches
perf-stat.page-faults
1.28e+06 ++------------O--------------------------------------------------+
| |
1.27e+06 ++ O O O |
| OO O OO OO O O |
1.26e+06 O+ OO O O O O OO OO O |
| |
1.25e+06 ++ |
| |
1.24e+06 *+ .* |
| * * * * * * : |
1.23e+06 ++ : + : : :+ + :+ : : |
| *.* *.**.* .* *. .* : * * *.: * *. .**. .**.**. *.*
1.22e+06 ++ *.* * ** * *.* * * ** * |
| |
1.21e+06 ++---------------------------------------------------------------+
perf-stat.context-switches
1e+07 ++----------------------------------------------------------------+
| *. .**.*.**.**. *.* .* .*. |
9.5e+06 *+* ** **.*.**.* *.*.**.** * **.**.**.*.**.**.**.*
| |
9e+06 ++ |
| |
8.5e+06 ++ |
| |
8e+06 ++ |
| |
7.5e+06 ++ |
| O O |
7e+06 O+OO O OO OO OO OO O OO OO OO O OO O |
| |
6.5e+06 ++----------------------------------------------------------------+
perf-stat.minor-faults
1.28e+06 ++------------O--------------------------------------------------+
| |
1.27e+06 ++ O O O |
| OO O OO OO O O |
1.26e+06 O+ OO O O O O OO OO O |
| |
1.25e+06 ++ |
| |
1.24e+06 *+ .* |
| * * * * * * : |
1.23e+06 ++ : + : : :+ + :+ : : |
| *.* *.**.* .* *. .* : * * *.: * *. .**. .**.**. *.*
1.22e+06 ++ *.* * ** * *.* * * ** * |
| |
1.21e+06 ++---------------------------------------------------------------+
turbostat.Avg_MHz
600 ++--------------------------------------------------------------------+
| *. .*. **. *.* * .* .* .*. .*. |
| : *.**.*.** ** : *.** * : *.*.* : * *.* * ** **.*
550 ++ : : : : : : : :: : |
| : : : : : : : : : : |
| : : : : :: : : : : : |
500 ++: : : : : :: :: : : |
| : : : : : :: :: : : |
450 ++: : :: : : : : |
*.* O : : : : *: |
| * * * * * |
400 O+ O O OO O OO O |
| O O O O OO OO O OO O OO O |
| |
350 ++--------------------------------------------------------------------+
turbostat._Busy
30 ++---------------------------------------------------------------------+
| *. *. *.* **. * *. *. .*. .*. |
28 ++ : *.**.*.*.* *.* : *.*.* * : *.** : * *.* * ** **.*
| : : : : : : : : : |
| : : : : :: : : :: : |
26 ++ : : : : : : : : :: : |
| : :: :: : : : : : : |
24 ++: :: :: : : : : : : |
| : : :: : : : : |
22 ++: O : : : : : : |
*.* * * * * *.* |
| O O O |
20 O+OO O OO O O O O O O O |
| OO O O OO O O |
18 ++---------------------------------------------------------------------+
apachebench.time.percent_of_cpu_this_job_got
75 ++---------------------------------------------------------------------+
| *.*. .* *. |
70 ++ *.*. *. .*.* * * *.*.* * * *.** * **.*.**. .*.**.*.* .*
| : * * : : : : : : : : * * |
65 ++ : : : : : : : : : |
| : : : : : : : : :: : |
60 ++ : : : : : : : : : : : |
| : :: :: : : : : : : |
55 ++: :: :: : : : : : : |
| : O : : : : : : |
50 ++: : : : : *.: |
*.* * * * * * |
45 O+OO O OO O O O O OO O OO O O O O O O O |
| O O |
40 ++---------------------------------------------------------------------+
apachebench.time.elapsed_time
105 ++--------------------------------------------------------------------+
O OO O OO O OO OO O OO O OO O OO O OO O |
100 ++ |
95 ++ |
*.* * * * * ** |
90 ++: : : : : :: |
85 ++: O : : : :: :: |
| : : : : : :: :: : : |
80 ++ : : : : : :: :: : : |
75 ++ : : : : :: : : : : : |
| : : : : :: : : :: : |
70 ++ : : : : : : : : : |
65 ++ *.*. .*.* .*: :*. : : :.* : * : *. .*. *.*.**.*
| ** *.* * * *.** * * *.*.* *.* *.** * |
60 ++--------------------------------------------------------------------+
apachebench.time.elapsed_time.max
105 ++--------------------------------------------------------------------+
O OO O OO O OO OO O OO O OO O OO O OO O |
100 ++ |
95 ++ |
*.* * * * * ** |
90 ++: : : : : :: |
85 ++: O : : : :: :: |
| : : : : : :: :: : : |
80 ++ : : : : : :: :: : : |
75 ++ : : : : :: : : : : : |
| : : : : :: : : :: : |
70 ++ : : : : : : : : : |
65 ++ *.*. .*.* .*: :*. : : :.* : * : *. .*. *.*.**.*
| ** *.* * * *.** * * *.*.* *.* *.** * |
60 ++--------------------------------------------------------------------+
apachebench.connection_time.connect.max
16000 ++OO-O--O--O------OO------O-OO----O-O-------------------------------+
O O O O OO O OO OO O O |
14000 ++ |
12000 ++ |
| |
10000 ++ |
| |
8000 ++ |
| |
6000 ++ |
4000 ++ |
| *.* * * * * *.* * * ** * * * * |
2000 ++ : :+ + :+ +: + :+ : :: + :+ : :: + : :+ + : |
| : * * *.** :.* * :: :.* * : : : .** *.*.* *.** *.*
0 *+*----------------*---------*--*---------*--*-*--------------------+
vmstat.system.in
80000 ++------------------------------------------------------------------+
| *.* .*.**.*.**.* *.**.*.* * *.**.** .*. *.|
75000 ++ : * : : : : : : * **.**.*.** **.* *
70000 ++ : : : : :: : : : : |
| : : : ::: : : :: : |
65000 ++: :: :: :: : : : : |
| : :: : :: : : : |
60000 ++: : * : * *.: |
*.* * * * |
55000 ++ |
50000 ++ |
| O |
45000 ++ O |
O OO O O OO O O OO O OO O OO OO O OO O |
40000 ++------------------------------------------------------------------+
vmstat.system.cs
150000 ++------*----------------------------------------------------------+
| *.** **.**.*.* **.*.** * **.**.* * **.*.**.**.*. .**.*
140000 ++ : : : : : : : : : ** |
130000 ++ : : : : :: : : : : : |
| : : : : :: : :: : : |
120000 ++: :: :: : : :: : : |
110000 ++: :: : : : : : : |
| : : * : * *: |
100000 *+* * * * |
90000 ++ |
| |
80000 ++ O |
70000 ++ |
O OO OO O OO O O OO OO O OO OO O OO OO |
60000 ++-----------------------------------------------------------------+
[*] bisect-good sample
[O] bisect-bad sample
Disclaimer:
Results have been estimated based on internal Intel analysis and are provided
for informational purposes only. Any difference in system hardware or software
design or configuration may affect actual performance.
Thanks,
Xiaolong
View attachment "config-4.12.0-rc2-00594-gbc0d3d0" of type "text/plain" (159338 bytes)
View attachment "job-script" of type "text/plain" (7035 bytes)
View attachment "job.yaml" of type "text/plain" (4472 bytes)
View attachment "reproduce" of type "text/plain" (263 bytes)
Powered by blists - more mailing lists