CTPN/CRNN的OCR自然場景文字識別理解(二)

CRNN 1) 端到端可訓練(把CNN和RNN聯合訓練) 2) 任意長度的輸入(圖像寬度任意,單詞長度任意) 3) 訓練集無需有字符的標定 4) 帶字典和不帶字典的庫(樣本)都可以使用 5) 性能好,而且模型小(參數少) 網絡結構 架構包括三部分: 1) 卷積層,從輸入圖像中提取特徵序列; 2) 循環層,預測每一幀的標籤分佈; 3) 轉錄層,將每一幀的預測變爲最終的標籤序列。 在CRNN的底部,卷
相關文章
相關標籤/搜索