OCR技術淺探二: 文字定位和文本切割

文字定位 經過前面的特徵提取,我們已經較好地提取了圖像的文本特徵,下面進行文字定位。 主要過程分兩步: 1、鄰近搜索,目的是圈出單行文字; 2、文本切割,目的是將單行文本切割爲單字。  鄰近搜索 我們可以對提取的特徵圖進行連通區域搜索,得到的每個連通區域視爲一個漢字。 這對於大多數漢字來說是適用,但是對於一些比較簡單的漢字卻不適用,比如「小」、「旦」、「八」、「元」 這些字,由於不具有連通性,所以
相關文章
相關標籤/搜索