【MIG專項測試組】如何準確評測Android應用的流暢度？

時間 2019-12-08

標籤 MIG專項測試組如何準確評測 android 應用流暢欄目 Android 简体版

原文原文鏈接

轉自騰訊Bugly瀏覽器

葉方正，2008年加入騰訊，就任於無線研發部【專項測試組】。曾經負責多個產品的性能優化工做，積累大量的移動終端平臺優化以及評測經驗。性能優化

怎樣獲取SM值？工具

前文咱們分析了經過測量應用的幀率FPS並不能準確評價App的流暢度（如何量化Android應用的「卡」？流暢度原理&定義篇），FPS較低並不能表明當前App在UI上界面不流暢，而1s內VSync這個Loop運行了多少次更加能說明當前App的流暢程度。oop

那麼咱們能夠直接在App代碼中經過Choreographer的回調FrameCallback來計算Loop被運行了幾回，從而知道應用的流暢度。但在實際狀況下咱們不必定能修改代碼（實際發佈的版本不容許加入測試代碼）或者根本拿不到代碼（譬如和競品進行對比）。性能

今天咱們介紹一種更簡單直觀測量Android應用流暢度的方法，就是經過開源測試工具GT（http://gt.qq.com）。測試

一、先啓動要測試的應用。優化

二、啓動GT，在插件中選擇GT Injector，再選擇被測進程，點擊「射它」。ui

三、點擊後，Para界面會出現流暢度指標以及被插入程序的CPU佔有率，而且會帶上被插入的進程名。將流暢度後面小方框勾選（表示須要記錄SM值到log文件），而後點擊右個角「Gather & Warning」下小紅圈（表示開始記錄數值）。spa

四、啓動App，開始作相關的測試。插件

五、完成測試後，在GT界面點擊流暢度(SM)，則會出現已經記錄的SM值圖表，點擊右上角磁盤圖標，保存log到指定名字的文件夾。

六、最後利用工具（好比應用寶），把log導入到PC端進行後期處理（通常狀況下，文件保存路徑在：SD卡/GT/GW/進程名/自定義文件夾）。

舒適提醒：以上的操做由於涉及到進程注入須要手機Root權限，若有問題，能夠加GT交流羣諮詢（QQ羣號：145535035）。

SM測試效果如何？

咱們已經收集了SM的測試數據，但測試數據是否準確？咱們拿一些瀏覽器產品爲例子，來評測下SM的數據和人的感覺是否對應得上。

首先，咱們爲了把感官和人的感覺對應上，特把主動感官分數對應到如下幾種描述。

流暢度主觀評分	描述
4~5	界面滑動流暢而且可以快速響應用戶輸入(各類操做)
3~4	界面滑動頓挫感而且可以及時響應用戶輸入(各類操做)
2~3	界面滑動明顯頓挫感響應用戶輸入(各類操做)有種慢半拍的感受
1~2	界面滑動明顯畫面跳躍感響應用戶輸入(各類操做)有嚴重的延遲
0~1	不能動了

一、先看看流暢度(SM)和丟幀(SF)之間的關係

測試場景：瀏覽器看妹子圖

評測手機：Nexus 4

流暢度主觀評分(整體)：2.5（界面滑動明顯頓挫感，響應用戶輸入有種慢半拍的感受）

由於丟幀是個不連續的過程，因此圖中的丟幀都是以點來表示其離散的狀態。從上面圖表能夠看出：

丟幀(SF)越多，流暢度(SM)越低。
26:16~26:42之間的流暢度很低，而且丟幀最密集。

再總體梳理一下這期間流暢度、丟幀和主觀評分的數據：

主觀評分	流暢度均值	丟幀均值
2.50	25.26	34.15

從這個數據能夠看到，丟幀(SF)越多流暢度(SM)越低，而且主觀感受比較卡，這個關係是成立的。

二、再引入FPS看看三者關係

測試場景：瀏覽器看妹子圖

評測手機：Nexus 4

流暢度主觀評分(整體)：2.5

此次測試引入了FPS數據，從圖表中能夠看出:

FPS曲線和SM曲線差很少，並且一樣受丟幀的影響。
有段比較奇怪的地方：流暢度很高，但FPS比較低，無丟幀狀況，將這段數據放大來看：

檢查這個時段的測試場景：靜置在某個界面沒有動，主觀評分在4.5左右。

再總體梳理一下這個時間段FPS、流暢度、丟幀和主觀的數據：

主觀分	流暢度均值	丟幀均值	FPS均值
4.5	58.375	0.5	16.333

能夠看出，流暢度SM會比FPS更加適合客觀描述App卡的程度。

如何有效利用SM值判斷App流暢度？

肯定了使用SM值來評估手機App的流暢度後，咱們會開始進行一個產品在不一樣場景，以及多個產品間在相同場景下的測試對比。場景太多，測試數據巨大，該如何有效使用SM測試結果去判斷App流暢狀況？

一、一些思路

不能直接用平均值和方差

根據以往經驗，經過平均值，方差等一些指標，並很差說明問題。若是卡頓時間出現較短，測試時間較長，則平均值和方差這種指標不容易發現問題，可是又確實有卡頓。平均值和方差適合描述服從正態分佈的隨機變量，可是測試獲得的SM值並非這樣的隨機變量。

將測試結果按卡頓和流暢分段，對每一個卡頓區間段打分

以前參考了一篇遊戲流暢度評分的文章，該文章結合FPS平均值和卡頓的程度以及頻率，對遊戲總體流暢度打分。可是普通App和遊戲的區別比較大。對普通App來講，用戶不是一直在操做，並且不一樣的操做差別也較大，所以卡頓的頻率通常較低，用平均值和卡頓的頻率打分獲得的結果可能會偏高。因此把測試過程按照卡頓和流暢分段，計算每一個卡頓區間的打分和持續時間可能更有參考意義。