软件测试:
瓶颈分析方法

1
、内存分析法
内存分析用于判断系统有无内存瓶颈,是否需要通过增加内存等手段提高系统性能表现。
内存分析需要使用的计数器:Memory
类别和
Physical Disk
类别的计数器。内存分析的主要方法和步骤:
(1
)首先查看
Memory\Available Mbytes
指标
如果该指标的数据比较小,系统可能出现了内存方面的问题,需要继续下面步骤进一步分析。
注:
在UNIX/LINUX
中,对应指标是
FREE(KB)
(2
)注意
Pages/sec
、
Pages Read/sec
和
Page Faults/sec
的值
操作系统回利用磁盘较好的方式提高系统可用内存量或者提高内存的使用效率。这三个指标直接反应了操作系统进行磁盘交换的频度。
如果Pages/sec
的技术持续高于几百,可能有内存问题。
Pages/sec
值不一定大就表明有内存问题,可能是运行使用内存映射文件的程序所致。
Page Faults/sec
说明每秒发生页面失效次数,页面失效次数越多,说明操作系统向内存读取的次数越多。此事需要查看
Pages Read/sec
的计数值,该计数器的阀值为
5
,如果计数值超过
5
,则可以判断存在内存方面的问题。
注:在UNIX/LINUX
系统中,对于指标是
(page)si
和
(page)so.
(3)
根据
Physical Disk
计数器的值分析性能瓶颈
对Physical Disk
计数器的分析包括对
Page Reads/sec
和
%Disk Time
及
Aerage Disk Queue Length
的分析。如果
Pages Read/sec
很低,同时
%Disk Time
和
Average Disk Queue Length
的值很高,则可能有磁盘瓶颈。但是,如果队列长度增加的同时
Pages Read/sec
并未降低,则是内存不足。
注:在 UNIX/LINUX
系统中,对应的指标是
Reads(Writes)per sec
、
Percent of time the disk is busy
和
Average number of transactions waiting for service.
2
、处理器分析法
(1
)首先看
System\%Total Processor Time
性能计数器的计数值
该计数器的值体现服务器整体处理器利用率,对多处理器的系统而言,该计数器提醒所有CPU
的平均利用率。如果该值持续超过
90
%,则说明整个系统面临着处理器方面的瓶颈,需要通过增加处理器来提高性能。
注:多处理器系统中,该数据本身不大,但PUT
直接负载状况极不均衡,也应该视作系统产生处理器方面瓶颈。
(2
)其次查看每个
CPU
的
Processor\%Processor Time
和
Processor\%User Time
和
Processor\%Privileged Time
Processor\%User Time
是系统非核心操作消耗的
CPU
时间,如果该值较大,可以考虑是否能通过友好算法等方法降低这个值。如果该服务器是数据库服务器,
Processor\%User Time
值大的原因很可能是数据库的排序或是函数操作消耗了过多的
CPU
时间,此时可以考虑对数据库系统进行优化。
(3
)研究系统处理器瓶颈
查看 System\Processor Queue Length
计数器的值,当该计数器的值大于
CPU
数量的总数+
1
时,说明产生了处理器阻塞。在处理器的
%Process Time
很高时,一般都随处理器阻塞,但产生处理器阻塞时,
Processor\%Process Time
计数器的值并不一定很大,此时就必须查找处理器阻塞的原因。
%DOC Time
是另一个需要关注的内容,该计数器越低越好。在多处理器系统中,如果这个值大于
50
%,并且
Processor\%Precessor Time
非常高,加入一个网卡可能回提高性能。
3
、磁盘
I/O
分析法
(1
)计算梅磁盘的
I/O
数
梅磁盘的I/O
数可用来与磁盘的
I/O
能力进行对比,如果经过计算得到的每磁盘
I/O
数超过了磁盘标称的
I/O
能力,则说明确实存在磁盘的性能瓶颈。
每磁盘I/O
计算方法
RAID0
计算方法:(
Reads +Writes)/Number of Disks
RAID0
计算方法:(
Reads +2*Writes)/2
RAID0
计算方法:
[Reads +(4*Writes)]/Number of Disks
RAID0
计算方法:
[Reads +(2*Writes)]/Number of Disks
(2)
与
Processor\Privileged Time
合并进行分析
如果在Physical Disk
计数器中,只有%
Disk Time
比较大,其他值都比较适中,硬盘可能会是瓶颈。若几个值都比较大,且数值持续超过
80
%,则可能是内存泄漏。
(3
)根据
Disk sec/Transfer
进行分析
一般来说,定义该数值小于15ms
为
Excellent
,介于
15
~
30ms
之间为良好,
30
~
60ms
之间为可以接受,超过
60ms
则需要考虑更换硬盘或是硬盘的
RAID
方式了。
4
、进程分析法
(1
)查看进程的%
Processor Time
值
每个进程的%Processor Time
反映进程所消耗的处理器时间。用不同进程所消耗的处理器时间进行对比,可以看出具体哪个进程在性能测试过程中消耗了最多的处理器时间,从而可以据此针对应用进行优化。
(2
)查看每个进程产生的页面失效
可以用每个进程产生的页面失效(通过PRCESS\PAGE FAILURES/SEC
计数器获得)和系统页面失效
(
可以通过
MEMORY\PAGE FAILURES/SEC
计数器获得
)
的比值,来判断哪个进程产生了最多的页面失效,这个进程要么是需要大量内存的进程,要么是非常活跃的进程,可以对其进行重点分析。
(3
)了解进程的
Process/Private Bytes
Process/Private Bytes
是指进程所分配的无法与其他进程共享的当前字节数量。该计数器主要用来判断进程在性能测试过程中有无内存泄漏。例如:对于一个
IIS
之上的
WEB
应用,我们可以重点监控
inetinfo
进程的
Private Bytes
,如果在性能测试过程中,该进程的
Private Bytes
计数器值不断增加,或是性能测试停止后一段时间,该进程的
Private Bytes
仍然持续在高水平,则说明应用存在内存泄漏。
注:在UNIX/LINUX
系统中,对应的指标是
Resident Size
5
、网络分析法
Network Interface\Bytes Total/sec
为发送和接收字节的速率,可以通过该计数器值来判断网络链接速度是否是瓶颈,具体操作方法是用该计数器的值和目前网络的带宽进行比较。
RAID0
计算方法:
[Reads +(2*Writes)]/Number of Disks
(2)
与
Processor\Privileged Time
合并进行分析
如果在Physical Disk
计数器中,只有%
Disk Time
比较大,其他值都比较适中,硬盘可能会是瓶颈。若几个值都比较大,且数值持续超过
80
%,则可能是内存泄漏。
(3
)根据
Disk sec/Transfer
进行分析
一般来说,定义该数值小于15ms
为
Excellent
,介于
15
~
30ms
之间为良好,
30
~
60ms
之间为可以接受,超过
60ms
则需要考虑更换硬盘或是硬盘的
RAID
方式了。