物體檢測與識別——學習筆記

前言

自動駕駛、手勢控制、美顏相機網絡

發展：機器學習

傳統方法

直線檢測、形狀檢測學習

ADAS（Advanced Driver Assistant System）高級智能駕駛系統　　見：ADAS系統-ADAS|車道偏離預警|前車碰撞預警|行人識別|3D高清全景 http://www.adas.cc/adas/#_20url

ADAS的核心功能集中在前車碰撞預警（FCW）、車道偏離預警（LDW）、行人檢測預警（PCW）等。spa

檢測圓形：找到一個點到邊緣（由邊緣檢測來）的距離所有相等時，則斷定區域覆蓋爲圓形。.net

特徵+模型blog

CNN 卷積層，提取特徵相似HOG、LBP、Haarget

前面卷積和池化，提取特徵博客

全鏈接FC，或softmax（本質是將邏輯迴歸的二分類問題向多分類擴展），分類it

卷積核（kernel、window）獲得特徵圖（feature map）

sliding window

原始圖滑窗很慢，改成在特徵圖上滑窗就很快

滑窗大量重複信息

R-CNN(Regions with CNN features)

Region proposals 500-2000個可能區域。先相似K-means聚類，每個可能存在東西的部分都進模型檢測

NMS 抑制掉周圍方塊

仍是感受R-CNN框太多了，仍是沒法實時。

RCNN 提取特徵用的是神經網絡+SVM分類

Fast RCNN 特徵+分類都是神經網絡

Faster RCNN ，Region proposals也用神經網絡（RPN尋找潛在region）

YOLO 圖像分紅若干cell，只回歸一次，可將圖像中全部物體全都提取出來。很是先進、豪華。

bounding box 位置定位

x,y,w,h連續變量——>迴歸（解決的是在哪）

偵測到物體在哪，畫個框

圖像語義分割

更精細，像素級

卷積：

上卷積（反捲積）

端對端

較新的技術：

MASK-RCNN 反捲積造成Mask

U-NET層數比較少，醫學圖像

【其餘資料】

關於semantic segmentation的幾篇論文 - Marcovaldong的博客 - CSDN博客 https://blog.csdn.net/MajorDong100/article/details/78958656