物體檢測與識別——學習筆記

前言

自動駕駛、手勢控制、美顏相機網絡

發展:機器學習

  • 50-60s 看
  • 70-90s 看懂
  • 90s-2012  識別
  • 2012++理解

傳統方法

直線檢測、形狀檢測學習

ADAS(Advanced Driver Assistant System)高級智能駕駛系統   見:ADAS系統-ADAS|車道偏離預警|前車碰撞預警|行人識別|3D高清全景 http://www.adas.cc/adas/#_20url

ADAS的核心功能集中在前車碰撞預警(FCW)、車道偏離預警(LDW)、行人檢測預警(PCW)等。spa

檢測圓形:找到一個點到邊緣(由邊緣檢測來)的距離所有相等時,則斷定區域覆蓋爲圓形。.net

 

機器學習方法

特徵+模型blog

CNN 卷積層,提取特徵相似HOG、LBP、Haarget

前面卷積和池化,提取特徵博客

全鏈接FC,或softmax(本質是將邏輯迴歸的二分類問題向多分類擴展),分類it

卷積核(kernel、window)獲得特徵圖(feature map)

 

sliding window

原始圖滑窗很慢,改成在特徵圖上滑窗就很快

 

滑窗大量重複信息

 R-CNN(Regions with CNN features)

Region proposals 500-2000個可能區域。先相似K-means聚類,每個可能存在東西的部分都進模型檢測

NMS 抑制掉周圍方塊

 

仍是感受R-CNN框太多了,仍是沒法實時。

RCNN 提取特徵用的是神經網絡+SVM分類

Fast RCNN 特徵+分類都是神經網絡

Faster RCNN ,Region proposals也用神經網絡(RPN尋找潛在region)

YOLO 圖像分紅若干cell,只回歸一次,可將圖像中全部物體全都提取出來。很是先進、豪華。

 

bounding box 位置定位

x,y,w,h連續變量——>迴歸(解決的是在哪)

偵測到物體在哪,畫個框

 

semantic segmantation

圖像語義分割  

更精細,像素級

 卷積:

上卷積(反捲積)

 

端對端

 

較新的技術:

MASK-RCNN 反捲積造成Mask

U-NET層數比較少,醫學圖像

 

【其餘資料】

 關於semantic segmentation的幾篇論文 - Marcovaldong的博客 - CSDN博客 https://blog.csdn.net/MajorDong100/article/details/78958656

計算機視覺之語義分割 http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/

相關文章
相關標籤/搜索