《人臉識別與人體動做識別技術及應用》

人臉識別與人體動做識別技術及應用
曹林 2015/8/1 電子工業出版社算法

1、緒論
一、國內外人臉庫介紹:
1)、FERET人臉數據庫:美軍創建,在不一樣姿態、表情、光照條件下采集,西方人構成,人種單一
2)、CMU-PIE人臉數據庫:美卡梅隆大學創建,對姿態光照進行了嚴格控制
3)、YALE人臉數據庫:耶魯大學創建,15名志願者
4)、OLR人臉數據庫:劍橋大學AT&T實驗室創建,經常使用研究數據庫之一
5)、MIt人臉數據庫:麻省理工大學創建,16名志願者
6)、CAS-PEAL人臉數據庫:中科院創建,對應不一樣表情、光照、年齡、飾物等條件下
7)、BJUT—3D 3D人臉數據庫:北京工業大學創建
8)、CHUK素描人臉數據庫:香港大學創建數據庫

二、對人臉識別技術的影響的因素:
光照: 
解決辦法:a、經過算法進行光照補償處理,成本低但效果很差
b 、經過外部條件補光,效果好,成本大
姿態:
解決辦法:a、加入其餘類型姿態的人臉,比較麻煩
b 採用3D人臉,可旋轉改變姿態
目標圖像的分辨率:(分辨率高保留圖像的信息高)
解決辦法: a、加強監控設備
b利用圖像超分辨率算法重建安全

三、圖像超分辨率的介紹:
利用軟件的方法將一幅或多幅低分辨率的圖像重建成一幅高分辨率的圖像
應用前景:
公共安全領域、醫療圖像領域、衛星遙感圖像領域、軍事應用領域、數字電視領域、歷史以及人文照片的復原
發展前景:
證件識別(護照等。。。)、刑偵破案、重要地方的監控系統、高清視頻會議、人臉表情分析網絡

四、低分辨率圖像退化模型
退化模型:L(k)=DB(k)M(k)*H+n(k) (k是下標)機器學習

組成:運動形變、模糊、下采樣、噪聲
運動形變:實景與設備之間的相對運動
模糊:主要影響伊因素是光照
下采樣:下采樣會丟失圖像部分信息
噪聲:噪聲對人的影響噪聲能夠理解爲「 妨礙人們感受器官對所接收的信源信息理解的因素」。而圖像中各類妨礙人們對其信息接受的因素便可稱爲圖像噪聲 。學習

五、計算機視覺技術
目的:讓計算機能對外界獲取的信息進行智能化的分析與處理,模擬人腦功能
用途:提升視頻監控、安防系統等智能化程度,以便充分發揮視頻監控系統的主動監督做用、及時報警預防安全事故發生視頻

六、人體行爲視頻數據庫
Weizmann人體行爲數據庫:以色列科學院採集,在背景、拍攝角度不變狀況下,採集10種不一樣動做圖片

KThan人體行爲數據庫:瑞典皇家理工學院採集,背景相對靜止,鏡頭有拉近、遠的操做,採集6種不一樣動做圖像處理

中科院人體行爲數據庫:中科院創建,拍攝角度爲斜視、俯視、平視,包含單人以及多人交互行爲,8中單人行爲,多人交互行爲有劫持、打架等模板

2、人臉圖像配準和人臉檢測跟蹤
一、人臉配準
定義:將人臉圖像分辨率變爲一致,各個關鍵特徵部位的座標儘可能接近

2D人臉配準:(信息量少,特徵點很少,配準比較容易,算法也比較成熟)
手動標定:直接手動操做獲得各個特徵點座標再使用線性變換獲得配準
利用人眼檢測手段:尋找圖像特徵點再進行配準 (人眼濾波器)
二者之間:少許人眼檢測須要進行手動校訂:

3D人臉配準:
除了顏色信息、位置信息,3D人臉配準還多了深度
將3D轉化爲2D圖像處理:

步驟:
一、獲取紋理圖像:將3D圖像投射到XOY平面
二、檢測特徵點:利用人眼濾波器找到人眼位置,使用邊緣檢測找到人臉的大概位置
三、細化特徵點位置:算法:ASM算法、VOSM算法(ASM算法的改進)
ASM算法原理:先創建形狀模型、在局部灰度模型、後得到局部灰度特徵模板

二、人臉檢測
指對輸入的視頻或圖片中,確認是否有人臉的存在,如有則將人臉位置框出的過程,各個類型的人臉種類越多,人臉檢測算法的魯棒性越好

人臉檢測的兩大類:非學習檢測方法與學習檢測方法
非學習檢測方法:針對人臉的形狀、膚色已經運動軌跡等進行檢測(算法:Gobor圖形檢測,膚色檢測),檢測率不理想
學習檢測方法:即機器學習的方法,
又可分爲2類:非監督學習(錯誤與正確分類樣本不予區分)
監督學習(在下一輪學習中會更多注意上一輪錯分的樣本)

** 機器學習的方法過程:**
一、將樣本分類(正負樣本)
二、以某個樣本的特徵進行分類,獲得分類器
三、對各種特徵進行循環處理,對特徵進行組合,直到獲得最好檢測率,獲得最終分類器

人臉檢測的重要算法: 神經網絡、支持向量機(SVM)、AdaBoost算法 神經網絡: 支持向量機(SVM): AdaBoost算法:

相關文章
相關標籤/搜索