原文連接:mp.weixin.qq.com/s/z9QbjeoLo…html
以前經過三篇文章簡單介紹了機器學習經常使用的幾種經典算法,固然也包括了目前很火的 CNNs 算法了:git
這些算法各有各的優缺點和適用的領域,瞭解熟悉它們是頗有必要的,但如何應用它們還須要具體問題具體分析,而機器學習常見的應用方向,包括如下幾個:程序員
等等github
更詳細的能夠參考以前推薦過的一個網站:算法
這個網站很是詳細劃分了 16 個大方向,包括總共 1081 個子方向。若是想進入機器學習領域,首先仍是選擇一個方向領域,而後瞭解和熟悉該方向領域內所須要的算法,特定的解決技巧等。微信
固然,這篇文章主要介紹的是計算機視覺的應用,計算機視覺也算是這 16 個方向裏面最熱門也是發展最成熟的其中一個方向了。網絡
計算機視覺能夠分爲如下幾大方向:架構
雖然這裏說的都是圖像,但其實視頻也屬於計算機視覺的研究對象,因此還有視頻分類、檢測、生成,以及追蹤,但篇幅的關係,以及目前研究工做方向也集中於圖像,暫時就不介紹視頻方面應用的內容。app
每一個方向會簡單介紹該方向須要解決的問題,以及推薦一些 Github 項目、論文或者是綜述文章。
圖像分類,也能夠稱爲圖像識別,顧名思義,就是辨別圖像是什麼,或者說圖像中的物體屬於什麼類別。
圖像分類根據不一樣分類標準能夠劃分爲不少種子方向。
好比根據類別標籤,能夠劃分爲:
根據分類對象,能夠劃分爲:
根據類別數量,還能夠分爲:
one-shot
和 zero-shot
;推薦的 Github 項目以下:
論文:
文章:
經常使用的圖像分類數據集:
目標檢測一般包含兩方面的工做,首先是找到目標,而後就是識別目標。
目標檢測能夠分爲單物體檢測和多物體檢測,即圖像中目標的數量,例子以下所示:
以上兩個例子是來自 VOC 2012 數據集的圖片,實際上還有更多更復雜的場景,如 MS COCO 數據集的圖片例子:
目標檢測領域,其實有不少方法,其發展史以下所示:
從上圖能夠知道有幾個方法系列:
Github 項目:
論文:
文章:
經常使用的數據集:
圖像分割是基於圖像檢測的,它須要檢測到目標物體,而後把物體分割出來。
圖像分割能夠分爲三種:
一個圖形分割的例子以下所示,下圖就是一個實例分割的例子,用不一樣的顏色表示不一樣的實例。
Github:
論文:
文章:
風格遷移是指將一個領域或者幾張圖片的風格應用到其餘領域或者圖片上。好比將抽象派的風格應用到寫實派的圖片上。
一個風格遷移的例子以下, 圖 A 是原圖,後面的 B-F 五幅圖都是根據不一樣風格獲得的結果。
通常數據集採用經常使用的數據集加一些著名的藝術畫做品,好比梵高、畢加索等。
Github:
論文:
文章:
圖像重構,也稱爲圖像修復(Image Inpainting),其目的就是修復圖像中缺失的地方,好比能夠用於修復一些老的有損壞的黑白照片和影片。一般會採用經常使用的數據集,而後人爲製造圖片中須要修復的地方。
一個修復的例子以下所示,總共是四張須要修復的圖片,例子來自論文"Image Inpainting for Irregular Holes Using Partial Convolutions"。
論文:
Github:
文章:
超分辨率是指生成一個比原圖分辨率更高、細節更清晰的任務。一個例子以下圖所示,圖例來自論文"Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network"。
一般超分辨率的模型也能夠用於解決圖像恢復(image restoration)和修復(inpainting),由於它們都是解決比較關聯的問題。
經常使用的數據集主要是採用現有的數據集,並生成分辨率較低的圖片用於模型的訓練。
Github:
論文:
文章:
圖像生成是根據一張圖片生成修改部分區域的圖片或者是全新的圖片的任務。這個應用最近幾年快速發展,主要緣由也是因爲 GANs 是最近幾年很是熱門的研究方向,而圖像生成就是 GANs 的一大應用。
一個圖像生成例子以下:
Githubs:
論文:
文章:
人臉方面的應用,包括人臉識別、人臉檢測、人臉匹配、人臉對齊等等,這應該是計算機視覺方面最熱門也是發展最成熟的應用,並且已經比較普遍的應用在各類安全、身份認證等,好比人臉支付、人臉解鎖。
這裏就直接推薦幾個 Github 項目、論文、文章和數據集
Github:
論文:
文章:
數據集:
實際上還有其餘不少方向,包括:
Show and Tell: A Neural Image Caption Generator, 2014.
AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks, 2017.
Colorful Image Colorization, 2016.
Cascaded Pyramid Network for Multi-Person Pose Estimation, 2017
還有包括 3D、視頻、醫學圖像、問答、自動駕駛、追蹤等等方向,具體能夠查看下面這個網站:
paperswithcode.com/area/comput…
而若是認定一個方向,想開始學習這方面的內容,首先推薦能夠先查找中文方面的綜述文章或者論文,固然若是英語閱讀能力比較好的,也能夠查看英文的綜述文章,經過看綜述來查看下本身須要閱讀的論文,論文推薦先看最近3-5年內的論文,太太久遠的論文,除非須要更加深刻了解某個算法,不然都不太須要閱讀。
此外,就是須要結合實際項目來加深對算法的瞭解,經過跑下代碼,也能夠更好了解某個算法具體是如何實現的。
參考
本文簡單介紹了幾個計算機視覺方面的應用,包括應用解決的問題以及推薦了幾個 Github 項目和論文、文章,和經常使用數據集。
歡迎關注個人微信公衆號--機器學習與計算機視覺,或者掃描下方的二維碼,你們一塊兒交流,學習和進步!