怎樣提升紙質文件拍照掃描水平

 常工做和生活中,經常須要將紙質文件轉換成可編輯的文本,一字一句地手動輸入很是浪費時間,好在隨着科技的發展,不少OCR軟件公司爭相推出了圖片文字識別軟件,有了它,只需將紙質文件拍照或掃描,就能將其轉化爲可編輯的文本,方便又快捷。但在操做過程當中,因爲拍照光線等問題致使圖片模糊而引發的圖片文字識別率不高是不少人的困擾,對文件進行拍照須要必定的技巧和實踐,相機的性能與拍攝條件也很重要哦。性能

  文件拍照技巧字體

  拍照以前:網站

  一、確保頁面徹底契合在鏡頭框以內;spa

  二、確保光線均勻分佈於頁面,且不存在暗區或陰影;orm

  三、若有須要可將頁面放平,而後將相機位置調整到與文件頁面平行,以便鏡頭可以對準所拍攝文本的中心區域。圖片

  數碼相機配置get

  最低配置it

  ?200萬像素傳感器form

  ?變焦透鏡(定焦相機、普通手機相機以及手持拍照設備拍攝出的圖像通常不適合OCR)軟件

  推薦配置

  ?500萬像素傳感器

  ?閃光禁用功能

  ?手動光圈控制或光圈優先模式

  ?手動對焦

  ?防抖動系統,不然推薦使用三腳架

  ?光學變焦

  拍攝模式

  光線

  確保光線充足(日光最佳)。如使用人工照明,則須要使用兩個投射光源,防止出現陰影。

  相機定位

  儘可能使用三腳架。將鏡頭位置調整到與文件頁面平行,並將鏡頭對準文本中心區域。如採用全光學變焦,相機與文件之間的距離必須足以將整個文件契合至鏡頭框以內,一般該距離爲50-60 cm。

  閃光

  儘可能關閉閃光以免頁面出現炫光及銳化陰影。如光線不足,請嘗試在50cm的距離使用閃光,或使用輔助照明(推薦)。注意!在拍攝光面紙文件時使用閃光將形成極差的炫光。

  白平衡

  若是相機具備白平衡選項,建議使用一張白紙對白平衡進行校準,不然請選擇最適合當前光線條件的白平衡模式。

  如遇光線不足、照片太暗、對比度過低、照片不夠清晰等問題,請參考各類狀況下如何提升ABBYY FineReader 12照相質量尋找解決方案。

  文件掃描技巧

  識別質量很大程度上取決於圖像的質量,而圖像的質量取決於掃描設置。

  字體過小

  掃描字體小、分辨率較高的印刷文件時,典型文本推薦採用300dpi(10pt或更大的字體),更小的字體(9pt或更小)的印刷文本採用400-600dpi。

  調節亮度

  以黑白模式掃描時,可能須要調整亮度設置。大多數狀況下,50%的中間值就已足夠,可是若是生成的圖像含有許多「斷裂」或「擁簇」疊加的狀況,請參考PDF Transformer+「調整亮度」警告消息解決辦法。

  印刷質量

  印刷質量不佳的文件,如存在「雜點」(如隨機黑點或斑點)、模糊及不規整文字或偏斜線及偏移表格邊框的狀況,最好採用灰階模式進行掃描。在識別從低級到中等印刷質量的文件時,灰階模式能夠保留更多掃描文本中的文字信息。

  更多關於ABBYY FineReader 12OCR技術的信息,可點擊進入ABBYY中文網站查看相關的信息。

相關文章
相關標籤/搜索