Beam Search、GREEDY DECODER、SAMPLING DECODER等解碼器工作原理可視化以及在自然語言生成領域的使用

圖像標註的任務讓我們可以構建和訓練一個爲任何給定圖像生成字幕的神經網絡。在設計時使用瞭解碼器的來完成文字的生成。當我們描述了每個解碼器的工作原理時,我發現當它們被可視化時,更容易理解它們。 圖像標註任務流程圖 與翻譯模型類似,我們的圖像字幕模型通過輸入圖像張量和特殊的句首標記(即)來啓動字幕生成過程。這個模型生成了我們單詞的概率分佈(實際上是logits)。橙色方框顯示解碼算法的選擇,幫助我們選擇
相關文章
相關標籤/搜索