[轉]經常使用OCR軟件介紹

轉載出處:http://blog.csdn.net/zhulinu/article/details/9095585html

經常使用OCR軟件介紹                          api

 
一、ABBYY ***ABBYY FineReader 簡介:馳名品牌,全球都在用,國外4大OCR公司之一,衆多打印機、掃描儀都自帶它爲ocr軟件。安裝程序約300MB,選擇詞庫安裝後約500MB。 評價:功能齊全,衆多軟件中應該是第一。 缺點:佔cpu/內存大。有時會識別出一些不存在的字(和正確的字很相像,但不存在。造字?) 友情提醒:Win有Corporate 和Professional (企業和專業)版,也有蘋果Mac版,你們選本身要的。 ***ABBYY Screenshot Reader 簡介: 功能相似漢王屏幕摘抄、Mini Ocr是專門OCR識別屏幕截圖用的。
二、I.R.I.S. Readiris 簡介:馳名品牌,全球都在用,國外4大OCR公司之一,衆多印機、掃描儀都自帶它爲ocr軟件。安裝程序約200MB,選擇詞庫安裝後約100MB。 評價:功能能夠,對錶格的識別率ms比ABBYY FineReader高。沒遇到FineReader的造字問題。 缺點:沒自帶校對功能。 友情提醒: 必定用Asian版,沒寫Asian的不支持中文! 導入圖片時勾上「使用300dpi分辨率」 否則若圖片不達標會彈出提示叫你從掃。 (廢話,我要是有好的幹嗎不用,設計師nc) Win有Corporate 和Professional (企業和專業)版,也有蘋果Mac版,你們選本身要的。
三、漢王 簡介:國產企業,值得支持 缺點:不支持多頁單TIF文檔 *** 漢王文本王文豪7600 評價:功能滿全的,自帶的幾個小工具不錯(漢王拼圖精靈、漢王屏幕摘抄、漢王照片摘抄) 友情提醒: 1.貌似該公司目前開發重點是硬件,2007後出了文本王文豪7600就沒更新了。 2.網上一個366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 這兩個文件夾,你們裝hwdocsafe 文件夾裏的。另166MB的是光光hwdocsafe 這個文件夾。 3.設置裏選「忽略段內回車換行」。 4.漢王屏幕摘抄、漢王照片摘抄貌似是用特徵庫,效果跟Mini Ocr同樣。因此識別結果跟文本王不同。 *** 漢王 PDF OCR 簡介: 中止開發文本王可是品牌名聲和功能仍是要維護的。這個無償使用的才40MB。 評價: 什麼PDF OCR啊?個人一個圖像pdf就根本識別不了.... *** 漢王尚書七號 簡介:尚書OCR軟件是MICROTEK中晶科技公司,向漢王科技購買受權,贈送給用戶使用的舊版OEM軟件。安裝程序約60MB. *** Founder 方正OCR 簡介:原本不想寫這個的,方正OCR軟件是方正公司,向漢王科技購買受權,贈送給用戶使用的舊版OEM軟件。安裝程序約40MB. *** 漢王文友 簡介:舊版 *** 超星閱覽器 簡介:向漢王買的技術。 *** RapidScan高速掃描影像優化OCR識別系統 簡介:向漢王買的技術。
四、清華文通TH-OCR 簡介:國產(清華+文通)+國外企業Scansoft Nuance,值得支持,與漢王不一樣的是清華國際知名度比較好。微軟向他買技術,滿多印機、掃描儀也帶它爲ocr軟件。 評價:功能還能夠,(能夠把漢王認爲是國內的FineReader ,清華則是Readiris....或者反過來?) 嗯nb!還帶語音效稿! 缺點:不支持多頁單TIF文檔 友情提醒:"清華紫光OCR"是舊版 *** 文通慧視小靈鼠 簡介:簡單的說就是增長了手寫識別的加強版。 *** CAJViewer 簡介:向清華買的識別程序。 *** 《文檔天地》綜合管理與處理系統 簡介:向清華買的技術。 *** netocr.net在線OCR 簡介:
應用了由清華大學電子系研製的國際領先的最新OCR識別技術,提供一天以內不超過99幅圖像的免費的文字識別服務。 還有後臺人工校對識別。。。
由文通搞的,貌似搞不下去了。
六、Microsoft微軟 簡介:微軟,nb公司啊!開玩笑,其實用清華(中文?)和Scansoft Nuance(英文?)的引擎。 Office Document Imaging Office OneNote 評價:用的像是清華早期的特徵庫。比較可笑的是,網上有人測試的比清華如今的詞庫識別好。 缺點:懶着寫 友情提醒: 默認裝了跟Office的相同語言的特徵庫,其餘語言特徵庫手動添加,若裝office多語言版ms就免了. ***老馬的 UnicornViewerPdg2PicTextForever 簡介:套用微軟yy過的OCR引擎和詞庫來實現批量OCR http://www.comicer.com/stronghorse/water/software/pdg2text.htm *** 創華OCR 簡介:套用微軟yy過的OCR引擎和詞庫
七、Adobe Acrobat Pro 簡介:Adobe,nb公司啊!開玩笑,實際上是買IRIS Readiris的技術。 評價: 其實他的OCR技術也是給圖片式PDF用的,識別後會在圖片PDF的文字上附上識別文字,這樣你能夠拷貝pdf上的東西. (表達能力有限,相似onenote的使用方法) 缺點:沒自帶校對功能。 友情提醒:不是免費的Reader,是Acrobat Pro或Acrobat Pro Extended版
八、Mini Ocr 簡介:做者馬飛濤知道是誰不?是護花使者的做者。用他的話說:
我在開發護花使者反黃圖像識別軟件的時候,遇到有些圖像裏,嵌有某些文字,若是能 把文字識別出來,圖像的含義就很容易讓計算機理解了。

是的,專門設計給截圖用的 評價:看看過濾效果,就知道多利害了吧,並且是他自制的特徵庫. 缺點:惋惜沒法手動選擇識別區域 友情提醒:有點相似漢王屏幕摘抄、漢王照片摘抄
九、文粹OCR 簡介:國產企業,值得支持。識別率不比漢王差! 缺點:功能不夠強大、完善。 友情提醒: 去worldrobot.NET/download.html 下最新2009版。華軍,天空的都不是最新版。 默認快捷方式「文粹OCR」是update.exe,爲避免每次升級,把路徑改爲WencuiOcr.exe。 ***文粹在線OCR 貌似搞不下去了。
十、Newsoft 丹青文件辨識系統 MaxReader、Presto OCR 簡介:應該是tw的Newsoft公司和國外Presto合搞的(這不重要)。 這Presto公司在9x年代買了ABBYY的識別引擎,而後丹青又買/合做/使用了Presto版的ABBYY識別引擎。(10年前舊版的ABBYY不支持中文,因此有的搞,不過如今。。。。) 評價:看他網上上吹的多nb(10年前的技術也敢吹?!),可是識別繁體豎排或簡體都不見得有多好。安裝程序越越約300MB,安裝後130MB。 缺點:懶着寫 友情提醒:我情願用漢王,這不過是個舊版的ABBYY
十一、Scansoft Nuance 簡介:國外4大OCR公司之一,本身號稱全球都在用(估計沒算中國),微軟、清華還向他買技術 ***OmniPage (最貴的,$499.99 ) ***PaperPort (才$79.99 ) ***TextBridge (才$79.99 ) 友情提醒+評價 缺點:吹的多nb。下一個MULTi LANGUAGE多語言版,500MB,嚇一跳。打開後發現帶2個軟件OmniPage和PDFCreate5。咱們固然裝最貴的OmniPage咯,實際安裝程序越越約300MB。選擇安裝後250MB,kao,中文詞庫只不過是作樣子呢!難怪微軟也同時向清華買OCR技術。
十二、ExperVision TypeReader 簡介:新人可能不知道,可是n年前仍是滿有名的。 (才$395.00 )同時也曾是國外4大OCR公司之一。 評價:ms2008年後就沒更新,之前拿了n多獎,若oem盤有帶,用來ocr英文還能夠。 25MB。 缺點:不支持中文算不? 友情提醒:此東東很差下,沒特別須要別下
1三、賽酷OCR 簡介:使用雲系統來OCR,說土點就是叫你裝一個客戶端,把圖片上傳到服務器上,識別後再發回來。 優勢:機子配置很差的,用這東東佔資源少。客戶端安裝文件也小。 缺點: 識別率不咋的,可能還沒丹青好。除了簡體,繁體豎排根本不行。 機密文件你甲認爲我會安心上傳給你? 萬一斷網,偶要OCR咋辦? 友情提醒:偶就納悶,網上關於該軟件的評價很高。 (有人發帖問用啥OCR軟件好,基本上就有人回「用賽酷」)就首次使用送10次識別,網上可能有那麼多有錢的潛水支持者?可見確定是1毛黨!
1四、SimpleOCR 簡介:原本不想寫這個的,可是這免費的東東名聲蠻大的,我不說,人家可能會去下。 缺點:不支持中文
1五、奧普ocr 簡介:中止開發的東東。
服務器

 

注1:以上,就前9名OCR軟件值得試! 注2:在線網頁OCR不實際 注3:該軟件的比較寫於2010年,估計5年內有效 注4:此貼由winny社長驗證,內容很是包青天 注5:軟件按引擎Engine+詞庫分類

 

備註:

本人測試過Tesseract,漢王,識別看看三款軟件。

識別看看的識別率最高。好像是一我的開發的。牛啊。 順便給他作個推廣吧,http://blog.sina.com.cn/u/2863794612

相關文章
相關標籤/搜索