谷歌街景中路牌、廣告等標識文字的識別(文本識別在自然場景下的應用)之文本識別分類器

1.簡介 谷歌街景中的文本讀取主要分爲文本檢測和文本識別。這兩個模塊各使用了一個訓練好的CNN分類器用於字符的判斷和識別。CNN基於字符訓練數據集中的正樣本和負樣本,從中學習字符的特徵表達,並訓練形成最終的分類器。 文本檢測模塊訓練的是一個2元分類器,用於判別該CNN視野範圍內是否包含文字,稱爲字符判斷分類器;文本識別模塊訓練的是一個62元分類器(針對10個數字和52個大小寫英文字母),識別該CN
相關文章
相關標籤/搜索