【原創 深度學習與TensorFlow 動手實踐系列 - 4】第四課:卷積神經網絡 - 高級篇網絡
提綱:機器學習
1. AlexNet:現代神經網絡起源性能
2. VGG:AlexNet加強版學習
3. GoogleNet:多維度識別優化
4. ResNet:機器超越人類識別設計
5. DeepFace:結構化圖片的特殊處理blog
6. U-Net:圖片生成網絡圖片
7. 實例:剖析VGG,用模型進行模型參數可視化,特徵提取,目標預測ip
期待目標:深度學習
1. 掌握AlexNet結構特色,神經網絡各層之間特徵傳導關係,模型參數總數計算
2. 瞭解VGG,GoogLeNet,ResNet等複雜ImageNet模型的結構特色,簡單設計思想
3. 針對特殊數據,特殊任務設計的神經網絡結構
4. 深度剖析VGG TF代碼,學會對已有模型進行參數讀取,目標預測,特徵提取。
AlexNet:現代神經網絡起源
背景介紹:
ImageNet Challenge:1000類物體,每類1000張圖片
傳統方法思路:
1. 圖片特徵提取
2. 機器學習分類
背景介紹:
2010年冠軍
System Overview
Dense Grid descriptor:HOG,LBP
Coding:Local coordinate super-vector
Pooling, SPM
Linear SVM
2011年冠軍:Xerox Lab
1. 特徵提取
2. Fisher 壓縮
3. SVM分類
VGG:AlexNet加強版
1. VGG-AlexNet 對比卷積層 - 卷積羣參數個數:138m - 60m
2. 識別率(top5)7.3% - 15.3%
VGG做用:
1. 結構簡單:同AlexNet結構相似,均爲卷積層,池化層,全鏈接層的組合。
2. 性能優異:同AlexNet提高明顯,同GoogleNet,ResNet相比,表現接近。
3. 選擇最多的基本模型:方便進行結構的優化,設計,SSD,RCNN,等其餘任務的基本模型(base model)
1. 爲何ResNet有效?
1. 前向計算:低層卷積網絡高層卷經濟網絡信息融合;層數越深,模型的表現力越強。
2. 反向計算:導數傳遞更直接,越過模型,直達各層。
人臉識別數據特色:
結構化:全部人臉,組成類似,理論上可以實現對齊
差別化:相同位置,形貌不一樣