OCR技術4-基於深度學習的文字識別（3755個漢字）

時間 2021-01-13

原文原文鏈接

上一篇提到文字數據集的合成，現在我們手頭上已經得到了3755個漢字（一級字庫）的印刷體圖像數據集，我們可以利用它們進行接下來的3755個漢字的識別系統的搭建。用深度學習做文字識別，用的網絡當然是CNN，那具體使用哪個經典網絡？VGG?RESNET？還是其他？我想了下，越深的網絡訓練得到的模型應該會更好，但是想到訓練的難度以及以後線上部署時預測的速度，我覺得首先建立一個比較淺的網絡（基於LeNet的