基於深度學習的天然場景文字識別

1.1引言 傳統光學字符識別主要面向高質量的文檔圖像,此類技術假設輸入圖像背景乾淨、字體簡單且文字排布整齊,在符合要求的狀況下可以達到很高的識別水平。git 與文檔文字識別不一樣,天然場景中的文字識別 -----圖像背景複雜、分辨率低下、字體多樣、分佈隨意等,傳統光學字符識別在此類狀況下沒法應用。算法 圖像理解:僅利用通常的視覺元素(如太陽、大海、山、天空等)及其相互關係,容易缺少足夠的上下文信息
相關文章
相關標籤/搜索