基於Faster-rcnn及FCN的中文OCR文本定位

啓發 光學字符識別(Optical Character Recognition, OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。通常分爲兩個步驟:文字定位,即找到文字在圖片中的位置;文字識別,即識別出找到的文字。文字定位也可能包含一些二值化,矯正的步驟。git 文字定位常見的算法MSER +SVM或者MSER + CNN,是一種自底向上的方法:首先產出大量MSER區域
相關文章
相關標籤/搜索