吳恩達機器學習筆記——照片OCR

照片OCR流水線 照片OCR是一種可以識別圖片中的文字內容的技術。 照片OCR的流水線可以分爲三步: 文本識別 字符分割 字符分類識別 文本識別 給定一組正負樣本進行模型訓練,從照片中識別出可能是文字的區域,在結果圖中,灰度越低,說明判斷爲文本的概率越大。 去除掉一些形狀不合理的部分。使得預判爲文本的地方擴大、相連。 滑動窗口 使用一個以一定步長移動的框,對框住的區域使用模型判斷是否爲正樣本。 在
相關文章
相關標籤/搜索