深度學習目前是一個很是活躍的領域---天天都會有許多應用出現。進一步學習Deep Learning最好的方法就是親自動手。儘量多的接觸項目而且嘗試本身去作。這將會幫助你更深入地掌握各個主題,成爲一名更好的Deep Learning實踐者。python
這篇文章將和你們一塊兒看一個有趣的多模態主題,咱們將結合圖像和文本處理技術來構建一個有用的深度學習應用,即看圖說話(Image Captioning)。看圖說話是指從一個圖像中基於其中的對象和動做生成文本描述的過程。例如:學習
這種過程在現實生活中有不少潛在的應用場景。一個明顯的應用好比保存圖片的描述字幕,以便該圖片隨後能夠根據這個描述輕鬆地被檢索出來。對象
咱們開始吧!blog
注意: 本文假定你瞭解深度學習的基礎知識,之前曾使用CNN處理過圖像問題。若是想複習這些概念,能夠先閱讀下面的文章:圖片
Fundamentals of Deep Learning – Starting with Artificial Neural Network
Architecture of Convolutional Neural Networks (CNNs) demystified
Tutorial: Optimizing Neural Networks using Keras (with Image recognition case study)
Essentials of Deep Learning – Sequence to Sequence modelling with Attention (using python)ci