OCR技術4-基於深度學習的文字識別(3755個漢字)

上一篇提到文字數據集的合成,現在我們手頭上已經得到了3755個漢字(一級字庫)的印刷體圖像數據集,我們可以利用它們進行接下來的3755個漢字的識別系統的搭建。用深度學習做文字識別,用的網絡當然是CNN,那具體使用哪個經典網絡?VGG?RESNET?還是其他?我想了下,越深的網絡訓練得到的模型應該會更好,但是想到訓練的難度以及以後線上部署時預測的速度,我覺得首先建立一個比較淺的網絡(基於LeNet的
相關文章
相關標籤/搜索