中國首份OCR白皮書出爐,基於深度學習的OCR已成主流

  掃一掃就能識別文字,這是近年來出如今不少應用中的新功能。好比,輸入銀行卡號時,直接用手機攝像頭掃一掃,軟件就能提取銀行卡信息。這裏用到的技術正是光學字符識別技術(Optical Character Recognition)。算法

  OCR 是光學字符識別(Optical Character Recognition)的縮寫,指利用機器將圖像中手寫體或印刷體的文本轉換爲計算機能夠直接處理的格式。做爲計算機視覺領域的重要分支,OCR 典型應用是經過圖像文字識別實現信息錄入。同時,因爲文字和符號包含豐富的語義信息,基於 OCR 提取文字信息繼而進行分析,可以幫助機器更好地理解圖像。安全

  9 月 28 日,在工業和信息化部、北京市人民政府、國際電信聯盟 ITU-T 指導的 2020 AIIA 人工智能開發者大會上,主辦方正式發佈國內首份智能文字識別(OCR)能力測評與應用白皮書。網絡

  白皮書從 OCR 發展背景、技術沿革、產業發展示狀、技術標準化、發展趨勢等多個維度,對當前國內 OCR 產業進行了一次詳細梳理,全面助推 OCR 技術產業化加速落地及可持續發展。佈局

  據瞭解,白皮書由中國信息通訊研究院、中國人工智能產業發展聯盟、騰訊公司相關部門聯合起草。性能

  新基建帶來新機遇,OCR技術發展三大趨勢學習

  藉助人工智能技術,近年來 OCR 性能的不斷提高爲產業數字化催生出的更復雜的 OCR 應用場景提供了堅實支撐。同時,覆蓋手機、電子產品以及雲服務在內的更加多樣化的服務載體,進一步加快了 OCR 的普及,持續向社會生產生活的更多領域滲透。測試

  尤爲是 2020 年 4 月,發改委明確將人工智能基礎設施列入 「新基建」 範圍,做爲人工智能應用中最接 「地氣」,商業推廣較爲成熟的領域,OCR 產業在「新基建」 背景下無疑將迎來新的發展機遇,相關技術也將迎來新一輪的變革。雲計算

  報告指出,OCR 技術將來發展的三大方向主要包括一體化的端到端 OCR 模型、兼具高性能高效率的 OCR、從感知到認知的智能 OCR。人工智能

  詳細來講,構建一體化的端到端網絡,同時對文字檢測和識別進行訓練,將成爲 OCR 技術發展的重要趨勢之一。端到端的網絡設計不只可以減小重複計算,又可以提升特徵的質量,促進任務性能的改善。設計

  同時,大量的 OCR 應用須要在資源受限的移動端設備上運行,當前移動端 OCR 算法大多以犧牲必定的算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量 OCR 模型將是將來發展的重要方向。

  另外,從感知到認知的智能 OCR 來講,OCR 技術一般從計算機視覺領域出發,將來與天然語言處理技術、知識圖譜等更廣領域的交叉融合,經過語義及知識的深度挖掘提高 OCR 性能是重要趨勢。

  此外,在 OCR 中引入強化學習和元學習等新的學習範式,讓機器自主學習如何識別文字,也將成爲研究熱點。

  市場規模達 133.81 億美圓,OCR 成科技巨頭標配

  目前,OCR 技術已在金融、保險、醫療、交通、教育等諸多行業有了深刻成熟的應用。將來隨着傳統行業的數字化轉型,OCR 應用範圍和場景將進一步擴展,市場規模將進一步增大。有權威機構預測,2025 年全球 OCR 市場規模將達到 133.81 億美圓。

  早期受限於技術發展水平,OCR 廠商一般從特定應用切入,例如車牌識別系統等,造成了一系列專用設備。近年來,愈來愈多的終端設備及應用均嵌入了 OCR 技術,並逐漸造成了從基礎設施、基礎能力到終端應用的完整產業鏈生態,也衍生出了卡證、票據等一系列細分 OCR 能力,經過組合的方式服務於各個行業。

  

  圖 | OCR 產業生態圖

  不難看出,OCR 技術逐漸 「下沉」 爲一項基本的能力,爲上層不一樣的業務應用提供底層技術支撐。科技巨頭和雲計算廠商正在紛紛加速佈局 OCR,在知足自身內部業務需求的同時,不斷對外開放先進的 OCR 能力,OCR 已然成爲科技巨頭能力標配。

  多行業場景成熟落地,首次發佈OCR評測標準

  在具體的落地應用層面,目前卡證識別、票據識別等標準場景文字識別已經相對成熟,手寫文字識別在教育、物流等行業的應用也在不斷擴大。複雜動態場景下的 OCR 技術和應用成爲近兩年的熱門研究方向,好比在無人駕駛、機器人等場景利用 OCR 對視場中出現的文字進行識別等。 在這次發佈的白皮書中,騰訊雲也公佈了其多項OCR領域的典型落地案例。

  值得一提的是,爲全面下降 OCR 相關領域的應用門檻,避免出現魚龍混雜局面,白皮書也首次公佈 OCR 評測標準和規範。

  2020 年 4 月,中國人工智能產業發展聯盟制定了《OCR 服務智能化分級技術要求和評估方法》,規定了 OCR 服務在功能、性能、安全等方面的技術要求以及評估方法。7 月,OCR 服務要求及評估方法在國際電信聯盟 ITU-T SG16 組成功立項,標誌着深度學習背景下的 OCR 評測方法已經逐漸被國際標準組織所接受。

  目前,由中國人工智能產業發展聯盟指導,騰訊雲開發的天鑑 OCR 服務引擎自動化評測平臺,不只可以爲 OCR 技術供給方提供技術測試服務,也將發佈 OCR 技術或產品的測試結果,爲需求方提供客觀公正的選型依據。

  -End-

相關文章
相關標籤/搜索