教你用PyTorch實現「看圖說話」(附代碼、學習資源)

深度學習目前是一個很是活躍的領域---天天都會有許多應用出現。進一步學習Deep Learning最好的方法就是親自動手。儘量多的接觸項目而且嘗試本身去作。這將會幫助你更深入地掌握各個主題,成爲一名更好的Deep Learning實踐者。python

這篇文章將和你們一塊兒看一個有趣的多模態主題,咱們將結合圖像和文本處理技術來構建一個有用的深度學習應用,即看圖說話(Image Captioning)。看圖說話是指從一個圖像中基於其中的對象和動做生成文本描述的過程。例如:學習

1c2e99c2a37e49b28a7764a261eca806129fa141

這種過程在現實生活中有不少潛在的應用場景。一個明顯的應用好比保存圖片的描述字幕,以便該圖片隨後能夠根據這個描述輕鬆地被檢索出來。對象

咱們開始吧!blog

注意: 本文假定你瞭解深度學習的基礎知識,之前曾使用CNN處理過圖像問題。若是想複習這些概念,能夠先閱讀下面的文章:圖片

d47e62d2b349aca45e42305ed6714efbe5ed61d9Fundamentals of Deep Learning – Starting with Artificial Neural Network
d47e62d2b349aca45e42305ed6714efbe5ed61d9Architecture of Convolutional Neural Networks (CNNs) demystified
d47e62d2b349aca45e42305ed6714efbe5ed61d9Tutorial: Optimizing Neural Networks using Keras (with Image recognition case study)
d47e62d2b349aca45e42305ed6714efbe5ed61d9Essentials of Deep Learning – Sequence to Sequence modelling with Attention (using python)ci

相關文章
相關標籤/搜索