vtune性能分析工具--找出程序性能瓶颈

时间:2021-04-11 19:51:55

1. 概述

VTune是Intel一个比较强大的性能分析软件。主要包括三个小工具:

(1)Performance Analyzer:性能分析,找到软件性能比较热的部分,一般也就是性能瓶颈的关键点。

(2)Intel Threading Checker:用于查找线程错误, 能够检测资源竞争、线程死锁等问题

(3)Intel Threading Profiler:线程性能检测工具,多线程可能存在负载比平衡, 同步开销过大等线程相关的性能问题,该工具可以帮你发现每一个线程每一时刻的状态。

2. 安装

linux上,解压文件vtune_amplifier_xe_2011_update1.tar.gz;

执行install.sh脚本,跟据提示下一步就可以;

安装一个windows客户端VTune_Amplifier_XE_2011_update3_setup.exe,用于将收集的数据进行图形界面展示。

3. 使用

VTune有两种工作方式,我们一般使用的是远程模式,

本地模式是被分析的程序和VTune同时工作在同一台机器上

远程模式是指程序在一台机器上,VTune装在另一台机器上

1)启动需要分析的应用程序,以is_searcher_server为例

/home/admin/intel/vtune_amplifier_xe_2011/bin64/amplxe-cl -collect hotspots is_searcher_server -c conf/searcher_server.cfg -l conf/searcher_log.cfg -k restart -d

其中,amplxe-cl是指列出本机所支持的分析类型,这里选择-collect hotspots收集热点,

还有amplxe-cl –report-list; 可支持的报告类型。

更多见http://software.intel.com/zh-cn/blogs/2010/11/10/amplxe-cl/ 

后面就是服务的启动参数。

服务启动后,会自动生成一个数据文件,名为r000hs(之后生成的会自动命名为r001hs,r002hs…)

2)启动其它服务程序,在施压一段时间后,停止被分析的程序(也就是这里的is_searcher_server)

这时,r000hs里存的就是收集的数据信息。要注意,一定要停止被分析程序,否则数据不会生成到r000hs里面。

3)启动windows客户端VTune_Amplifier_XE_2011_update3_setup,将数据r000hs导入,步骤如下:

file->open->result,将r000hs加载,但此时会很慢,解决办法,使用sumba共享服务器,将linux文件在windows下共享

原文:http://ju.outofmemory.cn/entry/1506