OCR技術起源mysql
OCR最先的概念是由德國人Tausheck最早提出的,1966年他們發表了第一篇關於漢字識別的文章,採用了模板匹配法識別了1000個印刷體漢字。早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究爲主,且識別的文字僅爲0至9的數字。以一樣擁有方塊文字的日本爲例,1960年左右開始研究OCR的基本識別理論,初期以數字爲對象,直至1965至1970年之間開始有一些簡單的產品,如印刷文字的郵政編碼識別系統,識別郵件上的郵政編碼,幫助郵局做區域分信的做業;也所以至今郵政編碼一直是各國所倡導的地址書寫方式。
20世紀70年代初,日本的學者開始研究漢字識別,並作了大量的工做。中國在OCR技術方面的研究工做起步較晚,在70年代纔開始對數字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年漢字識別的研究進入一個實質性的階段,很多研究單位相繼推出了中文OCR產品.早期的OCR軟件,因爲識別率及產品化等多方面的因素,未能達到實際要求。同時,因爲硬件設備成本高,運行速度慢,也沒有達到實用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。1986年之後我國的OCR研究有了很大進展,在漢字建模和識別方法上都有所創新,在系統研製和開發應用中都取得了豐碩的成果,很多單位相繼推出了中文OCR產品。進入20世紀90年代之後,隨着平臺式掃描儀的普遍應用,以及我國信息自動化和辦公自動化的普及,大大推進了OCR技術的進一步發展,使OCR的識別正確率、識別速度知足了廣大用戶的要求。(文章摘自百度百科)sql
OCR技術第一次商用及生活中的各種用途(車牌號識別、銀行卡號識別、車架號識別,快遞單號識別等),OCR技術的各家性能比較。數據庫
IBM公司最先開發了OCR產品,1965年在紐約世界博覽會上展出了IBM公司的OCR產品——IBMl287。當時的這款產品只能識別印刷體的數字、英文字母及部分符號,而且必須是指定的字體。20世紀60年代末,日立公司和富士通公司也分別研製出各自的OCR產品。全世界第一個實現手寫體郵政編碼識別的信函自動分揀系統是由日本東芝公司研製的,兩年後NEC公司也推出了一樣的系統。到了1974年,信函的自動分揀率達到92%左右,而且普遍地應用在郵政系統中,發揮着較好的做用。1983年日本東芝公司發佈了其識別印刷體日文漢字的OCR系統OCRV595,其識別速度爲每秒70~100個漢字,識別率爲99.5%。其後東芝公司又開始了手寫體日文漢字識別的研究工做。 工具
中國OCR技術領頭羊是誰,作到什麼程度?性能
中國在OCR技術方面的研究工做相對起步較晚,在20世紀70年代纔開始對數字、英文字母及符號的識別技術進行研究,20世紀70年代末開始進行漢字識別的研究。1986年,國家863計劃信息領域課題組織了清華大學、北京信息工程學院、瀋陽自動化所三家單位聯合進行中文OCR軟件的開發工做。至1989年,清華大學率先推出了國內第一套中文OCR軟件--清華文通TH-OCR1.0版,至此中文OCR正式從實驗室走向了市場。清華OCR印刷體漢字識別軟件其後又推出了TH-OCR 92高性能實用簡/繁體、多字體、多功能印刷漢字識別系統,使印刷體漢字識別技術又取得重大進展。到1994年推出的TH-OCR 94高性能漢英混排印刷文本識別系統,則被專家鑑定爲「是國內外首次推出的漢英混排印刷文本識別系統,整體上居國際領先水平」。上個世紀90年代中後期,清華大學電子工程系提出並進行了漢字識別綜合研究,使漢字識別技術在印刷體文本、聯機手寫漢字識別、脫機手寫漢字識別和脫機手寫數字符號識別等領域全面地取得了重要成果。具備表明性的成果是TH-OCR 97綜合集成漢字識別系統,它能夠完成多文種(漢、英、日)印刷文本、聯機手寫漢字、脫機手寫漢字和手寫數字的識別輸入。幾年來,除清華文通TH-OCR外,其它如尚書SH-OCR等各具風格的OCR軟件也相繼問世,中文OCR市場穩步擴大,用戶遍及世界各地。
能夠說目前印刷體OCR的識別技術已經達到較高水平。OCR產品已由早期的只能識別指定的印刷體數字、英文字母和部分符號,發展成爲能夠自動進行版面分析、表格識別,實現混合文字、多字體、多字號、橫豎混排識別的強大的計算機信息快速錄入工具。對印刷體漢字的識別率達到98%以上,即便對印刷質量較差的文字其識別率也達到95%以上。可識別宋體、黑體、楷體、仿宋體等多種字體的簡、繁體,而且能夠對多種字體、不一樣字號混合排版進行識別,對手寫體漢字的識別率達到70%以上。特別是我國的漢字OCR技術通過十幾年的努力,克服了起步晚、漢字字符集異常龐大等困難,單字的識別速度(指在單位時間內所完成的從特徵提取到識別結果輸出的字數)能夠達到70字/秒以上。字體
OCR技術的基本原理編碼
所謂OCR(Optical Character Reconginition 光字符識別技術),是指電子設備檢查紙上打印的字符,經過檢測暗亮的模式肯定其形狀,而後用字符識別方法將形狀翻譯成計算機文字的過程。以車牌識別爲例(文章來自CSDN的一篇博客):.net
一、車牌識別預處理:噪聲過濾、自動白平衡、自動曝光以及伽馬校對、邊緣加強、對比度調整等。翻譯
二、車牌識別車牌定位:在經過圖像預處理從此的灰度圖像上進行部隊掃描,斷定車牌區域。對象
三、車牌識別字符切開:在圖像中定位出車牌區域後,經過灰度化道閘、二值化等處理,精斷定位字符區域,而後依據字符尺度特徵進行字符切開。
四、字符識別:對切開後的字符進行縮放、特徵提取,與字符數據庫模板中的標準字符表達形式進行匹配區別。
五、效果輸出:將車牌識別的效果以文本格式輸出。
比較成熟的OCR產品有證件識別SDK、車牌識別SDK、文檔識別SDK、銀行卡識別SDK、表格識別SDK、票據識別SDK、名片識別SDK、護照識別SDK、身份證識別SDK等。