谷歌街景中路牌、廣告等標識文字的識別（文本識別在自然場景下的應用）之文本識別分類器

時間 2021-01-13

原文原文鏈接

1.簡介谷歌街景中的文本讀取主要分爲文本檢測和文本識別。這兩個模塊各使用了一個訓練好的CNN分類器用於字符的判斷和識別。CNN基於字符訓練數據集中的正樣本和負樣本，從中學習字符的特徵表達，並訓練形成最終的分類器。文本檢測模塊訓練的是一個2元分類器，用於判別該CNN視野範圍內是否包含文字，稱爲字符判斷分類器；文本識別模塊訓練的是一個62元分類器（針對10個數字和52個大小寫英文字母），識別該CN

>>阅读原文<<