前言
自動駕駛、手勢控制、美顏相機網絡
發展:機器學習
- 50-60s 看
- 70-90s 看懂
- 90s-2012 識別
- 2012++理解
傳統方法
直線檢測、形狀檢測學習
ADAS(Advanced Driver Assistant System)高級智能駕駛系統 見:ADAS系統-ADAS|車道偏離預警|前車碰撞預警|行人識別|3D高清全景 http://www.adas.cc/adas/#_20url
ADAS的核心功能集中在前車碰撞預警(FCW)、車道偏離預警(LDW)、行人檢測預警(PCW)等。spa
檢測圓形:找到一個點到邊緣(由邊緣檢測來)的距離所有相等時,則斷定區域覆蓋爲圓形。.net
機器學習方法
特徵+模型blog
CNN 卷積層,提取特徵相似HOG、LBP、Haarget
前面卷積和池化,提取特徵博客
全鏈接FC,或softmax(本質是將邏輯迴歸的二分類問題向多分類擴展),分類it
卷積核(kernel、window)獲得特徵圖(feature map)
sliding window
原始圖滑窗很慢,改成在特徵圖上滑窗就很快
滑窗大量重複信息
R-CNN(Regions with CNN features)
Region proposals 500-2000個可能區域。先相似K-means聚類,每個可能存在東西的部分都進模型檢測
NMS 抑制掉周圍方塊
仍是感受R-CNN框太多了,仍是沒法實時。
RCNN 提取特徵用的是神經網絡+SVM分類
Fast RCNN 特徵+分類都是神經網絡
Faster RCNN ,Region proposals也用神經網絡(RPN尋找潛在region)
YOLO 圖像分紅若干cell,只回歸一次,可將圖像中全部物體全都提取出來。很是先進、豪華。
bounding box 位置定位
x,y,w,h連續變量——>迴歸(解決的是在哪)
偵測到物體在哪,畫個框
semantic segmantation
圖像語義分割
更精細,像素級
卷積:
上卷積(反捲積)
端對端
較新的技術:
MASK-RCNN 反捲積造成Mask
U-NET層數比較少,醫學圖像
【其餘資料】
關於semantic segmentation的幾篇論文 - Marcovaldong的博客 - CSDN博客 https://blog.csdn.net/MajorDong100/article/details/78958656
計算機視覺之語義分割 http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/