导读

GT3.1的版本更新，带来了全面的维度分析。那么这些功能是如何实现的呢？本章GT君将详细的从CUP维度、内存维度、流量维度、流畅度维度为大家讲解这些功能的作用和实现原理。

1 CPU

/proc文件系统是一个伪文件系统，它只存在内存当中，而不占用外存空间。它以文件系统的方式为内核与进程提供通信的接口。从proc文件中可以获取系统、进程、线程的CPU时间片使用情况，所以两次采集时间片的数据就可以获取进程CPU占用率， CPU占用率 = (进程T2-进程T1)/(系统T2-系统T1) 的时间片比值。

1.1 获取系统CPU时间片

获取系统CPU时间片使用情况：读取proc/stat，文件的内容如下：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

文件第一行各个字段的含义：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

总的CPU时间：totalCpuTime = user + nice + system + idle + iowait + irq + softirq

1.2 获取进程和线程的CPU时间片

获取进程CPU时间片使用情况：读取proc/pid/stat，获取线程CPU时间片使用情况：读取proc/pid/task/tid/stat，这两个文件的内容相同，如下：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

标记中四位有对应字段的含义：

utime=41958：该任务在用户态运行的时间，单位为jiffies

stime=31：该任务在核心态运行的时间，单位为jiffies

cutime=0：累计的该任务的所有的waited-for进程曾经在用户态运行的时间，单位为jiffies

cstime=0：累计的该任务的所有的waited-for进程曾经在核心态运行的时间，单位为jiffies

进程的总CPU时间：
processCpuTime = utime + stime + cutime + cstime

线程的总CPU时间：
threadCpuTime = utime + stime + cutime + cstime

1.3 CPU数据的统计与分析

基础性能维度CPU取值是采用的是相对值：
processCpuTime /totalCpuTime。

线程时间片维度CPU取值采用的是每秒的绝对值，即threadCpuTime。

我们统计的CPU使用，也已经将GT引入线程的损耗在总体的CPU使用中排除，因此结果可靠。

2 内存

2.1 系统内存

（1）系统内存总容量：只需要读取“/proc/meminfo”文件的第一个字段“MemTotal”就可以了，代表着系统所有可用的RAM大小，文件的内容如下：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

（2）系统空闲的内存：只需要通过ActivityManager即可获取。

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

（3）系统已用内存：总内存与空闲内存做差。

2.2 进程内存

（1）进程内存上限：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

（2）进程总内存：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

3 流量

TrafficStats类是由Android提供的一个从你的手机开机开始，累计到现在使用的流量总量，或者统计某个或多个进程或应用所使用的流量，当然这个流量包括的Wifi和移动数据网Gprs。

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

获取进程流量的方法：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

4 流畅度检测

4.1 流畅值(SM)定义

Android系统每隔16.7ms发出垂直同步信号(VSync信号)(1000ms/60=16.66ms)，触发对UI进行渲染，如果每次渲染都成功，这样就能够达到流畅的画面所需要的60帧/s，为了能够实现60帧/s，这意味着计算渲染的大多数操作都必须在16.7ms内完成。

所以当绘帧间隔超过16.7ms，垂直同步机制会让显示器硬件等待GPU完成栅格化渲染操作, 我们就可以说此时掉帧了，也就会造成用户直接感官的卡顿。

在这里，我们把1秒内vSync信号的次数，定义为流畅值，即SM。

对于卡顿的不同情况我们分为以下两类：

（1）低流畅值区间：连续小卡顿造成的丢帧，即平均流畅值低于40帧/s的区间；

（2）单次大卡顿：单次大卡顿造成的丢帧，既两次绘帧间隔大于70ms，相当于丢了4帧以上的区间。

4.2 SM计算原理

首先Android的帧绘制流程是：CPU主线程图像处理->GPU进行光栅化->显示帧。APP产生掉帧的情况大多是由“CPU主线程图像处理”这一步超负载引起的，所以我们思考如何去监控主线程绘制情况。要检测CPU绘制帧的时间，就必须找到那个调用View.dispatchDraw的类，Choreographer类就是那个接受系统垂直同步信号(VSync信号)，在每次接受VSync信号时顺序执行View的Input、Animation、Draw等3个操作，然后等待下一个信号，再次顺序执行3个操作。如果第二个信号到来时，Draw操作没有按时完成，界面将不会更新，显示的还是第一帧的内容。这就表示丢帧了，丢帧是造成画面卡顿的原因。

所以我们可以向Choreographer类中加入自己的Callback,通过此Callback的doFrame函数我们可以统计一秒内帧绘制的次数，即流畅值SM，它能直观的代表当前时间段的流畅度。之所以不用FPS来代表当前流畅度，是因为Android系统默认在前台页面静止时，FPS可能为0，FPS低无法直接代表当前处于卡顿。

4.3 SM计算代码实现

利用Choreographer.FrameCallback计算流畅值相关代码：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

上述代码中的pushData会记录doFrame的执行信息，这样就可以统计出1S内的执行次数，算出SM。

4.4 如何正确采集耗时代码的调用栈信息呢？

要获取主线程的调用栈信息，我们需要创建一个新的线程，在新的线程中使用uiThread.getStackTrace()来获取主线程的栈信息。这里主要说明，采集栈信息的时机。

实现逻辑，使用handler的postDelayed方法延时发送stackCollectRunnable采集栈信息，延时时间为interval(30ms，大于正常绘制1帧的时间，略小于正常绘制2帧的时间)。每一次帧绘制皆会回调doFrame函数，如果每次回调的时间间隔不超过interval，那么消息队列中的栈采集消息将被移除，如果超时，那么消息未被移除，将开始栈信息的采集。基于此，就可以正确定位造成丢帧的耗时代码了。

建立一个新的线程：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

栈采集实现：

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

从代码可以注意到，每次采集完成，会发起下一条采集。如果下一次doFrame回调小于interval时间，stackCollectRunnable被移除，不再采集；如果下一次doFrame回调时间大宇interval时间，则stackCollectRunnable会执行采集操作；同时doFrame会在移除上一个stackCollectRunnable后新添一个stackCollectRunnable，保证如此循环，就能把所有丢帧时主线程的调用栈记录下来。

结语

下一篇《GT3.1 简化您的App性能测试（3）——原理讲解，溯本求源续》，GT君将继续为大家讲解页面启动时长维度、布局的构建与绘制维度、数据库操作维度的实现原理。

未完待续……

项目开源地址：
https://github.com/Tencent/GT

如果您有好的建议，可以留言给我们，谢谢！

版权所属，禁止转载！

扫描下方二维码，关注微信公众号：腾讯移动品质中心TMQ，获取更多测试干货！

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

秒客网

【腾讯TMQ】GT3.1简化您的App性能测试（2）——原理讲解，溯本求源

导读

1 CPU

1.1 获取系统CPU时间片

1.2 获取进程和线程的CPU时间片

1.3 CPU数据的统计与分析

2 内存

2.1 系统内存

2.2 进程内存

3 流量

4 流畅度检测

4.1 流畅值(SM)定义

4.2 SM计算原理

4.3 SM计算代码实现

4.4 如何正确采集耗时代码的调用栈信息呢？

结语

相关文章