SCATTER: Selective Context Attentional Scene Text Recognizer --- 論文閱讀筆記

Paper : https://arxiv.org/abs/2003.11288 SCATTER 在訓練過程中採用了帶有中間監督的堆疊式塊體系結構,從而爲成功訓練深度 BiLSTM 編碼器鋪平了道路,從而改善了上下文相關性的編碼。 解碼使用兩步注意力機制完成。 第一步是對CNN主幹的視覺特徵以及BiLSTM層計算的上下文特徵進行加權。 第二個注意力將這些特徵視爲一個序列,並加入到序列間的關係中。
相關文章
相關標籤/搜索