圖像轉文字技術實現原理

圖像轉文字的技術叫做image Caption。image caption的網絡結構其實是基於encoder_decoder結構的。 Image caption將Decoder中的rnn網絡換成了cnn網絡,將decoder中的rnn網絡換成了lstm網絡。 網絡結構如下圖所示: 兩個改進的方向: 1. 引入注意力機制 2. 引入高層語義模型
相關文章
相關標籤/搜索