【機器學習筆記】照片OCR

時間 2021-01-08

原文原文鏈接

照片OCR 照片OCR就是想要讀取圖像中的文字，因此工作流程如下： 1、文本檢測 2、字符切割 3、字符識別一、首先來看文本檢測——滑動窗口 1、先學習行人檢測的思路。 1）首先要確定檢測框的尺寸8040 拿到一個數據集，訓練出一個分類器，能夠判斷8040的圖像內有沒有行人。 2）對於輸入一張圖片，從圖片左上角開始劃一個檢測框，送入分類器識別是否有行人；再根據步長來移動檢測框，直到劃過了整張圖片

>>阅读原文<<