【機器學習筆記】照片OCR

照片OCR 照片OCR就是想要讀取圖像中的文字,因此工作流程如下: 1、文本檢測 2、字符切割 3、字符識別 一、首先來看文本檢測——滑動窗口 1、先學習行人檢測的思路。 1)首先要確定檢測框的尺寸8040 拿到一個數據集,訓練出一個分類器,能夠判斷8040的圖像內有沒有行人。 2)對於輸入一張圖片,從圖片左上角開始劃一個檢測框,送入分類器識別是否有行人;再根據步長來移動檢測框,直到劃過了整張圖片
相關文章
相關標籤/搜索