【計算機科學】【2012.05】基於卷積神經網絡的端到端文本識別

本文爲美國斯坦福大學(作者:DavidJ. Wu)的畢業論文,共60頁。 自然圖像中全端到端的文本識別是近年來計算機視覺和機器學習領域備受關注的一個具有挑戰性的問題。該領域的傳統系統依賴於精心設計的模型,這些模型結合了精心設計的特徵或大量的先驗知識。在這篇論文中,描述了一種將大型多層神經網絡的表現力與無監督特徵學習的最新發展相結合的替代方法。這種特殊的方法使我們能夠訓練高度精確的文本檢測和字符識別
相關文章
相關標籤/搜索