吳恩達機器學習筆記——照片OCR

時間 2020-12-30

原文原文鏈接

照片OCR流水線照片OCR是一種可以識別圖片中的文字內容的技術。照片OCR的流水線可以分爲三步：文本識別字符分割字符分類識別文本識別給定一組正負樣本進行模型訓練，從照片中識別出可能是文字的區域，在結果圖中，灰度越低，說明判斷爲文本的概率越大。去除掉一些形狀不合理的部分。使得預判爲文本的地方擴大、相連。滑動窗口使用一個以一定步長移動的框，對框住的區域使用模型判斷是否爲正樣本。在

>>阅读原文<<