1小時玩轉OCR實戰

在平常生活工做中,咱們不免會遇到一些問題,好比本身辛辛苦苦寫完的資料,好不容易打印出來卻發現源文件丟了。難的收集了一些名片,卻要很麻煩的一個一個錄入信息。快遞公司的業務愈來愈好,但天天卻須要花費不少時間登記錄入運單,效率很是的低。算法

那麼,有沒有什麼技術能幫助咱們解決這些難題呢?有的,那就是OCR文字識別技術。服務器

什麼是OCR?微信

OCR 是實時高效的定位與識別圖片中的全部文字信息,返回文字框位置與文字內容。支持多場景、任意版面下整 圖文字的識別,以及中英文、字母、數字的識別。通俗的來講,就是將圖片上的文字內容,智能識別成爲可編輯的文本,例如:網絡

OCR的技術原理是什麼?框架

OCR本質是圖像識別。其原理也和其餘的圖像識別問題基本同樣。包含兩大關鍵技術:文本檢測和文字識別。先將圖像中的特徵的提取並檢測目標區域,以後對目標區域的的字符進行分割和分類。學習

以深度學習興起的時間爲分割點,直至近五年以前,業界最爲普遍使用的仍然是傳統的OCR識別技術框架,而隨着深度學習的崛起,基於這一技術的OCR識別框架以另一種新的思路迅速突破了原有的技術瓶頸(如文字定位、二值化和文字分割等),並已在工業界獲得普遍應用。字體

首先文本定位,接着進行傾斜文本矯正,以後分割出單字後,並對單字識別,最後基於統計模型(如隱馬爾科夫鏈,HMM)進行語義糾錯。大數據

OCR技術的難點是什麼?優化

複雜背景、藝術字體、低分辨率、非均勻光照、圖像退化、字符形變、多語言混合、文本行復雜版式、檢測框字符殘缺,等等。人工智能

如何克服這些難點的?

從幾個方面入手。一是使用場景,另外一方面是從技術上的改進騰訊優圖實驗室在文本檢測技術方進行了深度優化,提出了Compact Inception,經過設計合理的網絡結構來提高各尺度的文字檢測/提取能力。同時引入RNN多層自適應網絡和Refinement結構來提高檢測完整性和準確性。

​​
騰訊雲OCR目前支持什麼功能?

基於騰訊優圖實驗室世界領先的深度學習技術,目前咱們已支持: 身份證識別,銀行卡識別,名片識別,營業執照識別,行駛證駕駛證識別,車牌號識別,通用印刷體識別,手寫體識別。

通用印刷體的技術難點,使用場景

你們都知道身份證識別可普遍應用在金融行業中,有用戶的身份認證中,能夠減小用戶的信息輸入,提高效率,提升用戶體驗,營業執照的識別徹底省去了手工錄入的繁瑣,還能夠爲企業省去大量的人力資源成本,這些場景你們都已經比較熟悉。

對於通用印刷體,騰訊優圖實驗室自主設計一整套全方位多尺度文字識別引擎,可攻破模糊,散焦,透視,文字部分遮擋的問題,識別準確率高達90%以上,處於業界領先水平。使用場景普遍,例如對任意版面上圖像的文字識別,可普遍應用在印刷文檔、廣告圖、醫療、物流等行業中的識別。

對於通用印刷體有沒有什麼好的例子?

例如這個廣告,內容多字體,中英文與數字混合,背景也比較隨意。我們的OCR經過透視矯正、去模糊等,能大幅還原圖像真實度,極大提高算法的魯棒性。

再例如識別文字密集,行間距小,透視畸變等的海報。人工識別須要不只耗費時間,肉眼也比較難識別。但騰訊雲OCR 設計了小而精的特徵提取網絡,配合先進的預處理技術,識別準確率高達93%以上。

有時候也會遇到識別率不理想的狀況,如何能夠提升識別準確率?

首先會確認下當前的場景,形成準確度不高的緣由。評估可提升的空間設計,以後作出相應的修改,列入預處理等等。

關於騰訊雲手寫體識別方面的案例

騰訊是國內首家將手寫體識別應用在複雜場景下的服務商,數字識別準確率高達90%以上,單字識別速度在15ms之內,複雜漢字準確率超過80%。

騰訊雲手寫體OCR已運用到的運單識別場景,解決了物流行業每日快遞單人工輸入工做量極大且極易出錯,很是低效等問題。


運單識別與傳統人工識別的區別

若是傳統人工識別按照3min/單,1000單須要6.25我的/天,保證運單時效則須要耗費大量人力,考慮人力成本則影響運單及時性,成本和服務難兩全。

咱們的運單識別速度能夠達到毫秒級/單,並支持24小時識別服務 ,業務增加時只須要投入計算用服務器資源便可,彈性較大。

與傳統識別相比,不只成本能夠下降,提升準確性,還能夠保護用戶的隱私泄露風險。

騰訊雲OCR在行業中落地案例

新版手Q就用到了我們的技術,在掃一掃、聊天窗口和空間圖片大圖預覽共三個入口上支持了提取圖片中文字的功能。

方便用戶閱讀、編輯、保存圖片上的文字,從而能夠對提取出的文字進行翻譯、搜索。在多種場景下能夠極大提高用戶對圖片上文字的閱讀和記錄效率。

企業微信中的名片識也用到了我們OCR技術。用戶只需拍照或選擇名片圖片,就能準確快速地識別出名片中的文字,並自動提取爲對應的字段,極大簡化了名片錄入流程,也避免了手動錄入過程可能出現的錯誤。

福利時間:

騰訊雲大學6月10日(週一)晚19:00-20:30邀請到大數據與人工智能產品中心大咖,開設免費線上直播課程,現場講解API落地使用!講師將會在直播課程中爲你們解答疑惑。

適合人羣:

  • 0-3歲開發者
  • OCR與人臉核身使用者
  • 人臉識別從業者
  • 對人臉識別感興趣的小夥伴

非開發者0基礎沒關係,現場手把手教學,一小時你能收穫的不止有實戰指導,更有鵝廠大咖的經驗分享!

大咖講師:
騰訊雲AI視覺產品項目經理 張誠

課程內容:
一、 騰訊雲OCR文字識別產品簡介
二、 OCR通用印刷體識別動手實驗室
三、 騰訊雲慧眼·人臉核身產品簡介
四、 人臉核身H5動手實驗室

如何觀看課程?
掃描下方海報二維碼便可預定課程,開播前15分鐘將短信通知!
​​圖片描述

重要提示:提早關注微信【學習君】,入羣還能夠領取更多鵝廠內部技術資料
​​圖片描述

相關文章
相關標籤/搜索