本文内容整理自公众号腾讯Bugly,感谢原作者的分享。
1、问题背景
对于Android应用来说,内存向来是比较重要的性能指标。内存占用过高,会影响应用的流畅度,甚至引发OOM,非常影响用户体验。因此,内存优化也向来是行业内的重点工作项和难点工作项。
手Q在很早之前就开发了很多内存优化技术:
1)自研内存泄露检测系统 LeakInspector天网:
LeakInspector是一套完整内存泄露检测系统:能够自动检测应用内存泄露问题;并提供兜底回收以及自动提单功能;
2)图片引用大图告警:
能够自动检测出业务图片不合理使用:比如解码的图片尺寸大于显示尺寸2倍以上等问题。推动业务进行专项优化;
3)内存触顶监控:
能够检测出内存不足时占用内存较高的业务场景,并定位到相应的页面,推动业务进行优化。
以上这些技术都取得了很好的内存优化效果,但他们的特点是:主要针对明显的内存问题,缺少更深入的内存分析。
因此,手Q内存问题也一直存在,主要表现在以下两方面:
1)手Q的平均内存一直持续增长,版本间增幅较高,手Q一月一个版本,平均每版本增长大概5.3M;
2)用户的OOM率大概0.1%。
这次我们主要从监控和清理两个角度出发,系统化的进一步优化手Q内存:
1)统一缓存监控:开发实现全面的内存缓存监控系统,能够更细致的监控手Q内存缓存使用情况,及时发现轻度不合理问题,推进优化;
2)内存清理 在监控的基础上,开发实现自动清理机制:一方面统一调度手Q各业务主动清理内存,另一方面,通过深入的技术研究,实现系统内存清理技术。
通过监控和清理相互配合,我们最终实现了优化手Q整体内存,降低OOM率的效果。以下是详细方案。
学习交流:
- 即时通讯开发交流群:320837163[推荐]
- 移动端IM开发入门文章:《新手入门一篇就够:从零开发移动端IM》
(本文同步发布于:http://www.52im.net/thread-1524-1-1.html)
2、相关文章
《腾讯技术分享:Android手Q的线程死锁监控系统技术实践》
《微信团队原创分享:Android内存泄漏监控和优化技巧总结》
《QQ音乐团队分享:Android中的图片压缩技术详解(上篇)》
《QQ音乐团队分享:Android中的图片压缩技术详解(下篇)》
《微信客户端团队负责人技术访谈:如何着手客户端性能监控和优化》
3、统一缓存监控
统一缓存监控主要包含图片缓存监控和业务对象缓存监控两部分:
1)图片缓存监控主要关注Bitmap的引用,定位图片问题;
2)业务对象缓存监控,主要监控手Q各业务对象缓存,及时发现缓存问题。
3.1图片缓存监控
对于Android应用来说,Bitmap向来是内存的占用大户。在手Q中平均有300+ Bitmap对象。
统计显示:Bitmap引用内存占手Q总内存40%左右:
减少图片占用内存,需要规范图片缓存的使用。前期我们在手Q中封装实现了图片专用多级缓存QQLruChe,并要求各业务必须使用全局图片专用缓存来缓存图片。一方面可以方便调控图片缓存业务,另一方面,通过淘汰以及清理策略,可以有效控制图片缓存大小。但由于手Q业务众多,业务独立开辟图片缓存的情况还是时有发生。因此我们开发了一套图片缓存监控系统,及时检测出图片缓存私藏问题,同时也监控图片的其他不合理使用。
图片缓存监控使用内存快照技术实现,分为终端数据采集和后台数据分析两部分。
流程如下所示:
终端数据采集:客户端实时检测当前可用内存,当可用内存不足时,自动生成内存快照文件,上报到后台。
后台数据分析:在后台,我们实现了一套Hprof文件分析以及Bitmap引用归并技术,批量分析内存快照文件,输出Bitmap引用链并进行归类统计,过滤全局图片专用缓存以及View层引用后,分析出存在图片缓存私藏的业务。
实现图片缓存监控过程中我们主要遇到以下几个难点:
1)内存快照文件大,约300M左右:
内存文件过大会导致上传流量和存储成本比较大,而且上传耗时长。针对这个问题,一方面,我们对大盘用户采样上报,并提供良好的用户交互。另一方面我们深入分析内存快照采集原理,自研miniDump工具,通过native hook技术在生成内存快照时剔除了tyte[]数据,从而使文件体积减少70%;
2)内存快照文件人工分析成本高:
通过MAT人工分析内存快照文件耗时费力,而且分析数量有限,用户上报的内存文件很多,无法定位top问题。针对该问题,我们深入研究MAT插件技术,自研引用链分析以及Bitmap引用归并工具,自动化分析内存快照文件,归类Bitmap图片引用。
通过图片监控系统,我们有效检测出以下几类业务问题:
1)全局图片专用缓存占用空间大,存在优化空间:
bitmap引用链归并发现全局图片专用缓存占较高。同时,我们也统计了OOM用户全局图片缓存的内存量,平均约10M左右。因此有必要在内存不足时,自动trimToSize,释放内存空间;
2)业务bug——逻辑完成后,没有及时释放图片引用:
业务逻辑存在问题,比如有几类业务在页面退出后,没有及时释放背景图资源引用;
3)业务私自开辟图片缓存:
业务独立开辟缓存cache缓存bitmap,没有使用全局图片专用缓存;
4)业务缓存数据对象中引用图片:
业务内存缓存的数据对象中,含有bitmap成员,内存空间大。可优化为缓存key,bitmap对象存到全局图片专用缓存中;
5)图片静态引用:
定义静态的Bitmap或者Drawable对象,进程周期内,对象所引用的资源都无法释放。
在手Q730版本,图片缓存监控系统检测出32例业务问题,提单26例,累计节省内存约23M。
3.2业务对象缓存监控
业务对象缓存监控主要是通过实现自定义集合类,实时上报各业务内存缓存使用情况到后台。在后台分析归并,从而定位业务缓存问题。
如上图所示,业务对象缓存主要分为终端数据采集、后台数据分析、缓存清理三部分:
终端数据采集: 通过自定义实现QQHashMap,QQConCurrentHashMap,QQLruCache等集合类,在系统原有集合类基础上,封装统计功能,实时统计程序运行期间各缓存的内存指标:插入次数,查询次数,删除次数,遍历次数,命中次数,未命中次数,缓存使用率,内存占用等;
后台分析:分析终端上报的用户数据,对各业务缓存进行归类统计,统计出平均内存占用,最大内存占用,内存占用中位数,缓存命中率,缓存浪费率等指标;
内存清理:监控系统在监控的基础上,也增加了清理接口。当检测到当前可用堆内存比较低,用户处于内存高负荷状态时,统一调度清理逻辑,进行内存自清理优化。
通过统一缓存监控,我们检测出了很多业务缓存问题,主要可归为以下三类。
1)缓存浪费率高:
典型案例1:手Q表情某类缓存,平均浪费率超过88%,相当于缓存1000个对象,有800+没有使用过;
典型案例2:某红包模板缓存,存储后从不访问,浪费率100%。
针对这类问题,推动业务优化内存缓存结构,去除无用缓存,优化缓存方案,以降低浪费率。
2)缓存内存占用大:
典型案例1:手Q某新闻类图片缓存,私自缓存Bitmap,最大占用内存15M,占所有图片缓存的35%;
典型案例2:钱包类背景图缓存,内存占用约1M左右,使用后未及时释放。
针对这类问题,对于缓存图片的业务,推动业务接入全局图片专用缓存;对于非图片类业务,接入自动清理,及时释放内存空间。
3)缓存结构存在优化空间:
典型案例1:讨论组成员缓存,设计为LRUCache可淘汰缓存,但是用户未曾用满过。初始开辟空间过大;
典型案例2:未读消息缓存,极端用户缓存个数超过9000个,无数量上限控制。
针对这类问题,推动业务更新或者优化缓存结构,增加上限控制等。
4、内存清理
统一监控,可以有效发现业务缓存问题进行专项优化。但监控具有一定的滞后性,因此在监控的基础上,我们同时也增加了内存清理控制模块。
内存清理主要分为业务内存清理以及系统内存清理。业务内存清理,包含统一图片缓存清理,以及业务缓存对象清理两部分。这里前文已简单介绍。接下来我们介绍下两例系统相关的内存清理技术:系统ClassLoader内存清理和系统预加载图片清理。
4.1系统ClassLoader内存清理
前期,我们分析了很多内存快照,发现一个共性的问题:在内存快照中有个ZipFile对象,内存占用一直超过2.6M。这个zipFile被系统类ClassLoader引用。
通过分析系统源码,我们发现ZipFile记录了安装包所有的类文件信息,手Q安装包中有超过15000个文件,文件越多,zipFile占用内存就越大。
我们进一步分析ClassLoader相关源码,发现只有在调用ClassLoader的findResource方法查找图片等安装包内资源时,才会使用到ZipFile的内容,未发现其他使用场景。同时,通过findResource方式查找资源存在一定的弊端:耗时很长,在Android系统上不推荐使用。
详情分析可参考:
http://blog.nimbledroid.com/2016/04/06/slow-ClassLoader.getResourceAsStream-zh.html
综合评估,可以清理ClassLoader引用的这块内存。
清理主要面临以下几个难点:
1)Android系统碎片化严重,兼容性问题比较突出:
不同版本,zipFIle成员变量的位置以及变量名不同。zipFile初始化时机改变:4.3以前创建时即初始化,4.3之后,第一次访问才会初始化。各厂商对系统API内部修改无法预期;
2)强行清理,可能导致功能异常:
系统内部代码逻辑可能会受到影响,而且影响无法预期。手Q当前使用ClassLoader查找资源的业务功能会受到影响。后期新增业务无法预期,清理会导致系统功能失效;
3)清理后再次加载zipFile耗时长,可能导致卡顿。
下图是我们清理系统ClassLoader的实现方案,采用代理,兜底,缓存,上报等手段逐一攻克以上难点,完美实现清理系统ClassLoader内存的效果。
1)针对兼容性问题,我们通过反射代理替换了系统的ZipFile为HookZipFile,替换完成后,清理掉zipFile内存。替换机制兼容系统不同版本以及特殊机型,对系统逻辑无影响。
2)针对清理导致的功能异常,我们实现了兜底能力,下次访问时,会重新创建zipFile。
3)针对耗时问题,内部封装实现缓存功能。并针对业务访问增加堆栈上报,及时推动业务改用其他方式获取资源。
内存清理方案,通过内部兼容性测试,发布后外网无crash问题,通过不断迭代,兼容率达到100%。并且内存清理效果明显,平均清理内存量约2.6M。
4.2系统预加载图片清理
系统预加载图片缓存是zygote进程初始化时,通过preloadResources()预加载的通用图片资源,后续android应用进程都是从Zygote fork出来的,所以就继承了这部分预加载的图片资源。由于是静态强引用,这部分图片资源会一直占用内存空间。
预加载的好处在于系统只在zygote执行一次加载操作,所有应用用到该资源不需要再重新加载,减少资源加载耗时。与此同时,sPreloadedDrawables属于静态对象,会一直引用图片缓存,所以该系统机制会占用较高内存,在有些系统上,内存占用空间超过20M。
因此这里存在内存优化的空间,当内存占用高时,可以主动清理掉这部分内存,以便释放可观的堆内存空间,减少内存耗尽的风险。通过分析drawable加载机制的源码,我们了解到如果预加载的资源没有在sPreloadedDrawables中找到,会重新decode解码加载,不会影响现有功能。
因此清理后的风险可控,主要面临的难点是兼容性问题:
1)系统API变动较多:
sPreloadDrawables数据结构类型,对象存储位置,不同API版本之间都有改动;
2)厂商自定义修改较多:
比如:小米7.0系统以及华为部分机型各自扩展了ResourceImpl实现,自定义了自己的资源加载基类,导致无法定位到sPreloadDrawable;OPPO部分机型,修改了sPreloadDrawable类的属性等等。
下图是我们清理系统预加载图片缓存的实现方案,通过反射替换的方式,拦截替换系统的预加载缓存为自定义图片缓存,内部管理图片加载,在内存不足时,及时清理预加载图片缓存。
针对兼容性问题,我们实现了一套完备的兼容性方案:
1)替换前兼容检测;
2)系统版本兼容处理;
3)特定机型兼容处理;
4)失败上报统计,不断兼容。
系统预加载图片清理,通过不断迭代,已经可以兼容几乎所有机型。版本发布后,未引入系统功能异常以及外网crash问题。内存清理量比较可观:平均在15M左右,最高达到25M。
5、优化后的效果
5.1横向对比
在灰度阶段,我们对用户进行了ABTest测试,一半用户接入内存优化逻辑,一半用户不接入。大盘上报统计显示:优化用户OOM率明显低于未优化用户:OOM率由0.09%降至0.053%。
内存分布方面,内存优化显著降低了高内存用户占比。由3.05%降至1.7%。高内存用户是指当前可用内存不足20%的用户,是OOM高发用户群,降低这部分用户比例,可有效降低OOM率。
5.2纵向对比
我们从7.3.0版本接入内存优化,从版本迭代来看,优化效果显著:OOM率由0.09%左右降低至0.047%左右,降幅47%:
手Q版本间平均内存增幅明显放缓,版本增幅由5.8M左右降至1.14M左右:
附录:更多微信、QQ的文章汇总
[1] QQ、微信团队原创技术文章:
《腾讯技术分享:Android版手机QQ的缓存监控与优化实践》
《微信团队分享:iOS版微信的高性能通用key-value组件技术实践》
《微信团队分享:iOS版微信是如何防止特殊字符导致的炸群、APP崩溃的?》
《腾讯团队分享 :一次手Q聊天界面中图片显示bug的追踪过程分享》
《微信团队分享:微信Android版小视频编码填过的那些坑》
《微信团队披露:微信界面卡死超级bug“15。。。。”的来龙去脉》
《月活8.89亿的超级IM微信是如何进行Android端兼容测试的》
《微信客户端团队负责人技术访谈:如何着手客户端性能监控和优化》
《微信团队原创分享:Android版微信的臃肿之困与模块化实践之路》
《微信团队原创分享:微信客户端SQLite数据库损坏修复实践》
《腾讯原创分享(一):如何大幅提升移动网络下手机QQ的图片传输速度和成功率》
《腾讯原创分享(二):如何大幅压缩移动网络下APP的流量消耗(下篇)》
《腾讯原创分享(二):如何大幅压缩移动网络下APP的流量消耗(上篇)》
《如约而至:微信自用的移动端IM网络层跨平台组件库Mars已正式开源》
《开源libco库:单机千万连接、支撑微信8亿用户的后台框架基石 [源码下载]》
《微信新一代通信安全解决方案:基于TLS1.3的MMTLS详解》
《微信团队原创分享:Android版微信后台保活实战分享(进程保活篇)》
《微信团队原创分享:Android版微信后台保活实战分享(网络保活篇)》
《Android版微信从300KB到30MB的技术演进(PPT讲稿) [附件下载]》
《微信团队原创分享:Android版微信从300KB到30MB的技术演进》
《微信技术总监谈架构:微信之道——大道至简(PPT讲稿) [附件下载]》
《微信海量用户背后的后台系统存储架构(视频+PPT) [附件下载]》
《微信异步化改造实践:8亿月活、单机千万连接背后的后台解决方案》
《架构之道:3个程序员成就微信朋友圈日均10亿发布量[有视频]》
《微信团队原创Android资源混淆工具:AndResGuard [有源码]》
《移动端IM实践:Android版微信如何大幅提升交互性能(一)》
《移动端IM实践:Android版微信如何大幅提升交互性能(二)》
《移动端IM实践:WhatsApp、Line、微信的心跳策略分析》
《移动端IM实践:谷歌消息推送服务(GCM)研究(来自微信)》
《信鸽团队原创:一起走过 iOS10 上消息推送(APNS)的坑》
>> 更多同类文章 ……
[2] 有关QQ、微信的技术故事:
《技术往事:微信估值已超5千亿,雷军曾有机会收编张小龙及其Foxmail》
《2017微信数据报告:日活跃用户达9亿、日发消息380亿条》
《技术往事:创业初期的腾讯——16年前的冬天,谁动了马化腾的代码》
《技术往事:史上最全QQ图标变迁过程,追寻IM巨人的演进历史》
《开发往事:深度讲述2010到2015,微信一路风雨的背后》
《开发往事:记录微信3.0版背后的故事(距微信1.0发布9个月时)》
>> 更多同类文章 ……
(本文同步发布于:http://www.52im.net/thread-1524-1-1.html)
腾讯技术分享:Android版手机QQ的缓存监控与优化实践的更多相关文章
-
腾讯技术分享:GIF动图技术详解及手机QQ动态表情压缩技术实践
本文来自腾讯前端开发工程师“ wendygogogo”的技术分享,作者自评:“在Web前端摸爬滚打的码农一枚,对技术充满热情的菜鸟,致力为手Q的建设添砖加瓦.” 1.GIF格式的历史 GIF ( Gr ...
-
腾讯技术分享:微信小程序音视频技术背后的故事
1.引言 微信小程序自2017年1月9日正式对外公布以来,越来越受到关注和重视,小程序上的各种技术体验也越来越丰富.而音视频作为高速移动网络时代下增长最快的应用形式之一,在微信小程序中也当然不能错过. ...
-
微信技术分享:微信的海量IM聊天消息序列号生成实践(算法原理篇)
1.点评 对于IM系统来说,如何做到IM聊天消息离线差异拉取(差异拉取是为了节省流量).消息多端同步.消息顺序保证等,是典型的IM技术难点. 就像即时通讯网整理的以下IM开发干货系列一样: <I ...
-
腾讯技术分享:微信小程序音视频与WebRTC互通的技术思路和实践
1.概述 本文来自腾讯视频云终端技术总监rexchang(常青)技术分享,内容分别介绍了微信小程序视音视频和WebRTC的技术特征.差异等,并针对两者的技术差异分享和总结了微信小程序视音视频和WebR ...
-
腾讯QQ会员技术团队:以手机QQ会员H5加速为例,为你揭开sonic技术内幕
目前移动端越多越多的网页开始H5化,一方面可以减少安装包体积,另一方面也方便运营.但是相对于原生界面而言,H5的慢速问题一定被大家所诟病,针对这个问题,目前手Q存在几种方案,最常见的便是离线包方案,但 ...
-
Android:仿手机QQ好友动态的ListView
1.介绍: 本博客使用XListView模仿Android版QQ好友动态的ListView效果.效果截图例如以下: 效果图1 watermark/2/text/aHR0cDovL2Jsb2cuY3Nk ...
-
技术分享预告丨k3s在边缘计算中的应用实践
技术分享是在[Rancher官方微信技术交流群]里以图文直播+QA实时互动的方式,邀请国内已落地经验的公司或团队负责人分享生产落地的最佳实践.记得添加微信小助手(微信号:rancher2)入群,实时参 ...
-
Android:仿手机QQ朋友动态ListView
1.介绍: 使用此博客XListView模仿Android版本QQ朋友动态ListView效果.效果如下面的截图: watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZ ...
-
美团技术分享:大众点评App的短视频耗电量优化实战
美团技术专栏: 关注MAYOU18 前言 美团测试团队负责App的质量保证工作,日常除了App的功能测试以外,还会重点关注App的性能测试.现在大家对手机越来越依赖,而上面各App的耗电量,直接影响了 ...
随机推荐
-
ArcGIS Server For Linux 10.2.2安装
1.# yum install Xvfb# yum groupinstall "X Window System"# yum install gettext 2./usr/sbi ...
-
.woff HTTP GET 404 (Not Found)
原因:IIS没有添加woff字体的MIME类型,导致HTTP请求404 Not Found错误 解决办法: 1.在web.config中配置 <system.webServer> < ...
-
OpenStack 的windows镜像的开启办法
创建虚拟机 使用我们的管理平台的windows主机创建流程,创建一台主机.在vnc中能看到主机进入到系统中 需要点击按钮sendctrl进入输入密码阶段. 输入我们的镜像的默认密码:5@mdjkw 打 ...
-
[SAP ABAP开发技术总结]将文件存储到数据库表中,并可发送邮件
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
-
进程间通信之popen和pclose函数
常见的操作是创建一个管道连接到另一个进程,然后读其输出或向其输入端发送数据,为此,标准I/O库提供了两个函数popen和pclose.这两个函数实现的操作是:创建一个管道,调用fork产生一个子进程, ...
-
快速构建Windows 8风格应用8-贴靠视图
原文:快速构建Windows 8风格应用8-贴靠视图 本篇博文主要介绍如何切换出贴靠视图.关于贴靠视图的设计.关于贴靠视图的应用程序栏和如何实现贴靠视图. 如何切换出贴靠视图 第一步:水平方向全屏视图 ...
-
Python-基础学习-Day1
1 Python介绍 1.1 Python 是一门什么样的语言? python是一门动态解释性的强类型定义语言. 编译型的特点:可一致性差,运行速度快. 解释型的特点:边执行边解释,速度慢 1.2 P ...
-
bzoj 4974: 字符串大师
Description 一个串T是S的循环节,当且仅当存在正整数k,使得S是T^k(即T重复k次)的前缀,比如abcd是abcdabcdab的循环节 .给定一个长度为n的仅由小写字符构成的字符串S,请 ...
-
CSS中清除浮动的作用以及如何清除浮动
1.什么是浮动,浮动的作用 “浮动”从字面上来理解就是“悬浮移动.非固定”的意思.块级元素(div.table.span…)是以垂直方向排列,而在前端界面中往往要使用水平布局块级元素使界面更美观.这就 ...
-
STRING DELIMITED BY SIZE
The following COBOL program depicts the use of STRING DELIMITED BY SIZE IDENTIFICAT ...