在項目中,測試人員考覈每每成爲項目經理和測試經理的一個難題,怎樣評估測試人員的工做?怎樣定義測試質量的差異?本文經過從事測試工做多年中對不一樣項目的數據收集和網上有限資料的參考分析,思考總結出一套可行的方法,在此提供給你們。數據庫
長期以來,如何考覈測試人員的工做是富有爭論的話題, 一個理想化的方法是收集測試階段以後項目階段的缺陷來肯定系統測試的質量。可是,這種方法的不可操做性在於:一是維護和實施階段的缺陷難於收集;二是缺陷貫穿產品的整個使用週期,沒法窮盡,難於將時間段分割開來比較;三是成本過於龐大,時間跨度過長,起不到有效激勵的做用。能不能就在項目過程當中尋找能夠評價測試人員工做的方法呢?就這這個思路,本人摸索出一套有效的辦法。框架
首先聲明的是,第一,這套考覈方發在一個功能點估算超過 10000 個的項目中通過實踐,可是對於小項目而言,可能缺乏足夠的數據和必要性;第二,項目組內考覈的成功不能意味着在測試部門內能夠採用相似的考覈方法,僅提供一種參考方法,部門考覈可能更多考慮投入工程的工做量大小和任務分配重要性;第三,除了量化指標外,測試人員工做態度、工做能動性和技術學習意願要經過定性分析來獲得。工具
項目組測試人員考覈主要包括工做效率和工做質量兩大塊,工做效率用於考察活動,而工做質量用於考察產出物質量。因爲考覈基於測試過程進行,所以必須在過程結束以後才能進行。固然,因爲工程是分佈提交測試的,每個月能夠根據實際狀況進行月考覈,工程結束後或任務結束後在統一考覈。按照傳統測試周期,測試過程分爲:測試計劃、測試設計和測試執行三個方面進行。測試計劃屬於測試經理的範疇,在最後討論。測試人員主要是測試設計和測試執行,測試經理的考覈可包含在測試人員的考覈內,固然,這部分考覈也能夠歸入項目組中進行。考覈指標以下:學習
一 測試設計測試
工做效率相關指標spa
文檔產出率 這項指標值主要爲測試用例文檔頁數除於編寫文檔的有效時間得到。用於考察測試人員測試用例文檔的生產率大小。設計
公式:∑測試用例文檔頁數(頁) / ∑編寫測試用例文檔有效時間(小時)日誌
參考指標:根據項目彙總得出平均在 1.14 頁 / 小時左右,高於此值爲優,低於此值爲差。接口
用例產出率 這項指標值主要爲上述指標值的補充,用於考察測試人員測試用例產出率大小。測試文檔頁數可能包含的冗餘信息較多,所以要查看文檔中測試用例的多少。方法是測試用例文檔中測試用例編號總和數除於編寫文檔的有效時間。開發
公式:∑測試用例數(個) / ∑編寫測試用例文檔有效時間(小時)
參考指標:平均 4.21 個用例 / 小時
工做質量相關指標
需求覆蓋率 計算測試用例總數之和除於與之一一對應的功能點數之和,主要查看是否有功能點遺漏測試的狀況。
公式:∑測試用例數(個) / ∑功能點(個)
參考指標: 100 %。若是連功能指標都不能知足 100 %覆蓋,起碼說明測試不充分。這個指標收集起來至關困難,若是存在需求跟蹤矩陣或者測試管理工具能把用例與需求一一對應就容易得多。
注意:有的功能是難於測試的,那麼未能覆蓋到的需求要綜合分析,明確是測試人員遺漏?仍是沒法測試?這須要放入問題跟蹤表中進行後續跟蹤;另外,有的功能點包含的信息較多或者有的用例包含幾個功能點,這時只能把重複的功能點或重複用例按一個計,難於區分的要作說明。
文檔質量 測試用例進行評審和同行評審發現的缺陷數,或者將此缺陷數除於文檔頁數算出比率。此指標考察測試人員文檔編寫的質量如何。
公式:∑缺陷數(評審和同行評審)(個)
∑缺陷數(評審和同行評審)(個) / ∑測試用例文檔頁數(頁)
參考指標:因爲評審是發現的缺陷數是不固定的,所以,這個指標沒有可供參考的數值。若是缺陷數大小不能直接用於比較就使用缺陷 / 頁方式進行橫向對比。
文檔有效率 使用測試用例文檔進行測試時發現的系統測試缺陷數除於此文檔頁數。用於考察文檔是由有效的指導了測試工做。
公式:∑缺陷數(系統測試)(個) / ∑測試用例文檔頁數(頁)
參考指標:平均 2.18 個缺陷 / 頁
注意:若是存在測試人員在測試時建立新文檔用於輔助測試時應包含這一部分。
用例有效率 使用測試用例發現的所有缺陷除於測試用例數總和。這一指標是上一指標的補充指標,用於考察用例質量是否較高
公式:∑缺陷數(系統測試)(個) / ∑測試用例數(個)
參考指標:平均 0.59 個缺陷 / 用例,也就是說,每執行兩個用例才獲得 1 個缺陷,各工程有所不一樣,能夠本身實踐一下
二 測試執行
工做效率相關指標
執行效率 利用測試用例文檔頁數除於這次系統測試執行的時間總和(不包含用例文檔編寫時間)。補充指標方法是用例的個數除於這次系統測試的時間總和。用於得到工做中測試人員每小時執行測試的速度。
公式:∑測試用例文檔頁數(頁) / ∑執行系統測試的有效時間(小時)
∑測試用例數(個) / ∑執行系統測試的有效時間(小時)
參考指標:平均 0.53 頁 / 小時, 1.95 個用例 / 小時。即測試人員每小時執行半頁測試用例或者每小時執行 2 個測試用例。經過橫向比較,容易知道那位成員的執行效率較高。注意:執行效率高的不表明測試質量也高,甚至執行效率和測試質量成反比,因此後面工做質量的指標會補充這一部分的偏離。實際結果代表,用例執行效率高的成員,其缺陷發現率每每偏低,考覈若是不將此歸入進來也能夠將其做爲測試改進的一項重要數據進行收集。
進度偏離度 檢查計劃時間和實際時間的進度,方法是計劃時間差額減去實際時間差額除於實際工時總和,用於考察測試人員進度狀況,監控測試是否按照日程進行,是否知足了工程的進度要求。
公式:∑(計劃開始時間 - 實際開始時間)+∑(計劃結束時間 - 實際結束時間) / 總工時
參考指標: 15 % 進度偏離是個相對的指標,可能偏離了 20 個工做日,可是對於一個長達半年時間的測試而言偏離天數比上總體測試所需天數不足 15 %,可能偏離了 3 個工做日,可是對於一個只有 1 星期時間的測試已經超過了整個測試階段所需天數的 60 %。
注意:計算時分子分母要保持一致,即開始或結束時間已經去除了非工做日時間,則總工時也要去除非工做日時間。由於制定計劃時是根據每一個公司的工做日來制定的,也就是說,考慮了非正常工做日的日程。
測試進度也是考覈很重要的一步,若是沒有進度保證,全部的測試都存在風險,第一種方法是測試人員能夠採用自下而上的方式向測試經理報告計劃用時,這種方式風險比較少,我的根據本身能力大小肯定,可是缺點是存在測試人員虛報可能性。另外一種方法是測試經理進行估算後分配工做日程,這時估算是很重要的前提,除了依賴於測試經理的經驗外,對評估結果進行同行評審是很客觀可取的方法。
缺陷發現率 測試人員各自發現的缺陷數總和除於各自所花費的測試時間總和。因爲執行效率不能足夠表明測試人員是否定真工做,那麼,每小時發現的缺陷數就是重要的考覈指標,你的工做能夠經過這項指標獲得反饋。
公式:∑缺陷數(系統測試)(個) / ∑執行系統測試的有效時間(小時)
參考指標:平均 1.1 個缺陷 / 小時 假使有位測試人員沒有達到 1 小時發現 1 個缺陷,那麼,除非產品質量高、模塊較小,不然,就是他的缺陷發現能力不如其餘測試人員。固然,詳細分類中能夠根據發現重要缺陷的多少來定義缺陷發現能力。
工做質量相關指標
有效缺陷數 / 率 被拒絕和刪除的缺陷數總和,或者被拒絕和刪除的缺陷數總和除於缺陷總數。這項指標用於考察測試人員發現的、被確認爲缺陷的缺陷數高低或者百分比,數和比率越低測試質量越高。
公式:∑缺陷數(系統測試中被拒絕和刪除的)(個)
∑缺陷數(系統測試中被拒絕和刪除的)(個) / ∑缺陷數(系統測試)(個)
參考指標:平均 21.9 %(測試人員發現的每 100 個缺陷中平均有 22 個缺陷不被開發組確認、認爲不是「缺陷」或者錯誤錄入缺陷)。有效缺陷比率容易給出,可是有效缺陷數具體數據要根據項目狀況,沒法給出可參考的數值。
注意:這項指標可能有不正確的狀況,假使缺陷被拒絕和被刪除的緣由不是由於測試人員誤操做和需求理解等自身錯誤引發,而是系統自己不能實現或者數據錯誤引發的,那麼就要考慮剔除這部分。對於測試人員發現系統框架根本性的、初始化參數設置錯誤引起的、錯誤數據、錯誤環境等而開發人員因沒法修正、能夠經過改變環境而無需修改程序、從新導入數據、再次發佈從而拒絕或刪除的缺陷,應給予此測試人員獎勵。
嚴重缺陷率 這個比例用於彌補缺陷發現率的不足。主要是根據嚴重程度分類的缺陷數比所有缺陷或者有效缺陷數。通常而言,每一個公司基本把缺陷嚴重程度分爲嚴重、通常和微小,或者更細(一般等級數爲奇數)。另外,能夠對缺陷嚴重程度進行折算(嚴重:通常:微小 =1 : 3 : 5 )經過折算能夠得出權重,而後在計算測試人員分值,在此不冗述
公式:∑嚴重 / 通常 / 微小 / ∑缺陷數
∑嚴重 / 通常 / 微小 / ∑有效缺陷數
參考指標:嚴重 ~10% 通常 ~70% 微小 ~20% 。當測試人員發現的缺陷中嚴重錯誤比率越高,說明測試質量相對就好,一般嚴重程度缺陷數的分佈呈正態分佈。
模塊缺陷率 這個指標主要是根據一個單獨測試模塊的缺陷數除於模塊自己功能點數得出來的。假使一個模塊是單獨測試的話,很容易能夠和其餘模塊進行指標橫向對比,參照對應的測試人員,得出所測試模塊的缺陷數,能夠考察測試人員測試水平,也爲開發考覈提供數據。
公式:∑缺陷數(系統測試(個) / 功能點(個)
∑缺陷數(系統測試(個) / 子功能點(個)
參考指標 平均 3.74 個缺陷 / 功能點 1 個缺陷 / 子功能點
注意:有些功能點沒有子功能點,計算子功能點時要進行說明。
三 測試管理
開頭提到對測試經理的考覈就複雜一些,除了測試經理參與測試設計和執行外,還要考察他的測試管理能力,即測試計劃階段工做,其中
計劃質量 測試計劃的評審缺陷數或比率,能夠與其餘同類型項目或數據庫平均指標進行對比。
公式:∑缺陷數(評審和同行評審)(個)
∑缺陷數(評審和同行評審)(個) / ∑測試計劃文檔頁數(頁)
成本質量 成本度量主要放在工做量這塊。由於不管涉及工資仍是獎金,都要和工做量掛上關係。成本質量主要是對測試活動的計劃工做量總和比上實際的工做量數值總和。對測試人員考覈的進度偏離已經考慮了進度因素,而工做量涉及的是成本因素。
公式:∑測試活動計劃工做量(估算人日) / ∑測試活動的實際工做量(人日)
參考指標:原則上不能偏離計劃的 ± 15 %~ ± 20 %。實際上,這個指標是對成本的一種度量。對於一個大的項目來講,估算值每每差距很是大,階段統計時可能有± 500 %!!這時調整計劃是很必要的,在最終階段取考慮計算平均估算值。一個測試經理必須對完成任務的成本進行有效控制。
這兩項指標是相對容易量化的部分,而須要添加其餘量化指標須要綜合考慮由項目經理和測試部部門經理給出標準,例如管理用時比率(整個項目測試期間管理時間佔整個項目測試總時間)、系統總體缺陷數與其餘同類型項目或數據庫平均指標進行對比等等。
考覈具體方法:
1 .將各項指標進行彙總分析,得出總和表格,根據測試人員各項指標大小進行排行榜製做,如列出 1 、 2 、 3 、 4 名。
2 .肯定階段涉及的權重。例如將測試設計和測試執行權重各爲 50 %。其中,工做效率佔 40 %(即佔所在階段 20 %),工做質量佔 60 %(即佔所在階段 30 %)。
3 .肯定每類指標的分值,而後每類指標達到平均標準給 100 %,達不到或者超過根據 80 % ~120 %比率給分
4 .將比分統計出來後進行綜合評定,必要的話增長一些調整係數。
5 .最好將定性分析歸入進來,採用問卷調查和項目經理評分制度給出定性指標分數,建議這部分權重不要超過 10 %~ 15 %以保證測試考覈的可度量性。
當全部考覈分數給出以後,提醒一點的是,既然作了考覈,就必須公開這些結果,並且考覈具備導向型,不要讓考覈誤導了對質量工做的追求才是最重要的。
考覈注意事項:
1 .項目並非一個月就能完成的,如每個月進行,要考慮「可考覈部分」爲那些,挑選那些指標可以橫向對比,而後分階段、分任務評定。
2 .參與測試的時間長短也要給予重視,除了上述量化指標外,測試人員總體投入時間長短也是很重要的,加班也要做爲特殊考慮因素,也許某個測試人員只參加了測試執行 3 小時,各項指標都是良好的,可是不可能給他比其餘參與時間更長的人員更多的分數。這部分就是增長調整係數的緣由。
3 .測試經理的測試設計和執行部分和項目測試人員一塊兒考覈,可是測試管理工做要單獨考覈,做爲另外的加分,或者如文章前面所述歸入項目組給予考覈。由於測試經理在項目測試中起着管理者和質量保證負責人的角色,不要把他和其餘測試工程師平等對待。
4 .考覈前要考慮項目的實際狀況,不要盲目的輕易承諾測試組人員考覈會和薪金或者淘汰機制掛鉤,不然考覈會起到反效果。
項目組測試人員考覈的主要目的是在於激勵測試組測試人員工做,鼓勵能者,鞭策落後;另外,還能夠起到發現人才和查找不足的做用。考覈中即要體現多勞多得的原則,也要體現公正性和合理性原則,獎罰分明纔能有效促使質量管理工做的進步。要想考覈獲得滿意的效果,上述方法的重要的前提條件是:必需要在項目中充分收集相關的數據,包括採集缺陷數,記錄工時、提交詳細工做日誌和進行文檔配置管理,沒有這些數據,定量分析就無從談起,測試人員考覈也無從談起。
不懂技術的管理不是好管理,附上接口測試相關資料供閱:
連接:https://pan.baidu.com/s/1R1gIyktM2CqTSlZSnUppWQ 提取碼:rn4z