臨近畢業準備找工做,而機器學習方法是複習中不可缺乏的一個重要部分,因此本篇博文是將以前作過的一個項目裏面應用的機器學習方法——樸素貝葉斯方法,重點複習一遍。具體文章以下引用所示。框架
Zhang S, Chen Z, Gu S, et al. Breast tumor detection in double views mammography based on Simple Bias[C]. Medical Imaging Physics and Engineering (ICMIPE), 2013 IEEE International Conference on. IEEE, 2013: 240-244.機器學習
背景:乳腺腫塊檢測對於醫生來講是一個很繁雜的工做,若是能利用計算機輔助診斷的方法自動地識別乳腺鉬靶X射線中的可疑腫塊,並標記出來,能夠大大地減小醫生的重複性勞動,提升醫生的診斷效率。一般醫生會利用同側乳腺的兩個視圖進行同時比較,增長診斷結果的可靠性,所以咱們提出的方法也與此相似,分別對兩個視圖進行分類,而後再用貝葉斯分類器對單獨分類的結果進行綜合分類,從而綜合雙視圖的結果來進行判斷就能夠大大地增長分類精度。學習
方法:利用樸素貝葉斯方法訓練一種可以對乳腺鉬靶X射線的同側乳腺不一樣視圖(MLO視圖和CC視圖)的圖像中的可疑區域進行自動分類,綜合兩個視圖判斷其是否存在有腫塊。spa
概述:3d
1. 預處理雙側視圖的圖像,包括圖像預處理和可疑腫塊邊緣提取。圖像預處理包括中值濾波和對比度加強;邊緣提取包括ROI提取、小波變換模極大值法提取邊緣、形態學操做和區域增加。blog
2. 分別提取可疑區域的幾何特徵和紋理特徵,包括5個幾何特徵:the entropy of standard radius, roundness, roughness, variance of standardized radius, ratio of area;5個基於灰度共生矩陣的5個紋理特徵:energy, entropy, inverse difference moment, correlated coefficient, contrast。ci
3. 將提取的特徵輸入極限學習機(ELM)中進行學習,並獲得兩個視圖的分類結果。博客
4. 根據極限學習機對雙視圖分類的結果再用貝葉斯分類器進行綜合分類,提升分類精度。it
整體框架圖以下所示:io
文章貢獻點:
1. 利用同側雙視圖進行綜合分類,模擬醫生的診斷過程。
2. 將樸素貝葉斯分類器應用到乳腺腫塊的輔助診斷中。
因爲博客園中編輯公式不方便,因此如下內容以word截圖展示。
真陽(True Positive):TP,真陰(True Negative):TN,假陽(False Positive):FP,假陰(False Negative):FN。
指標 |
計算公式 |
準確率 |
(TP+TN) / (TP+TN+FP+FN) |
敏感性(真陽率,TPR) |
TP / (TP+FN) |
特異性(假陽率,FPR) |
TN / (TN+FP) |
錯誤正比率 |
TP / (TP+FP) |
錯誤負比率 |
TN / (TN+FN) |
注:以上指標均爲越高越好
用來評價分類器的ROC(Receiver Operating Characteristic)曲線:一個優良的二分類器應該具備很高的真陽率和很低的假陽率。那麼只須要只須要真陽性率和假陽性率就能夠畫ROC曲線。ROC空間將FPR定義爲x軸,TPR定義爲y軸。所以曲線與橫軸所圍區域面積越大,則認爲分類的效果越好。