《Recursive Recurrent Nets with Attention Modeling for OCR in the Wild》 筆記

     該文提出了一個基於注意力模型的遞歸循環神經網絡模型(R2AM),解決在在無字典約束的條件下,對自然場景文字進行識別.提出的模型主要有以下幾個優點:(1)採用了循環的CNN網絡,可以更加有效和準確地提取圖像特徵;(2)在一個隱式的字符級別識別模型中嵌入一個RNN網絡可以避免去使用N-元分析法;(3)採用軟注意力機制可以允許模型選擇性的利用特徵,並且運行採用標準的BP算法進行端到端的訓練。
相關文章
相關標籤/搜索