ABBYY圖片文字識別技術能夠用來作什麼

圖片文字識別軟件ABBYY FineReader是如今辦公室的必備軟件,它能夠識別JPG、GIF、PNG、BMP、TIF和PDF源文件、PDF掃描件,也就是說咱們在平常工做中可以遇到的不能編輯的文字均可以經過ABBYY FineReader圖片文字識別軟件來識別,識別獲得的文字能夠自由的進行編輯。有不少人有這樣的疑問,圖片文字識別軟件的技術原理是什麼呢?數據結構

圖片文字識別軟件

一、圖文輸入:是指經過輸入設備將文檔輸入到計算機中,也就是實現原稿的數字化。如今用得比較廣泛的設備是掃描儀。文檔圖像的掃描質量是OCR軟件正確識別的前提條件。恰當地選擇掃描分辨率及相關參數,是保證文字清楚、特徵不丟失的關鍵。此外,文檔儘量地放置端正,以保證預處理檢測的傾斜角小,在進行傾斜校訂後,文字圖像的變形就小。這些簡單的操做,會使系統的識別正確率有所提升。反之,因爲掃描設置不當,文字的斷筆過多可能會分檢出半個文字的圖像。文字斷筆和筆畫粘連會形成有些特徵丟失,在將其特徵與特徵庫比較時,會使其特徵距離加大,識別錯誤率上升。spa

二、預處理:掃描一幅簡單的印刷文檔的圖像,將每個文字圖像分檢出來交給識別模塊識別,這一過程稱爲圖像預處理。預處理是指在進行文字識別以前的一些準備工做,包括圖像淨化處理,去掉原始圖像中的顯見噪聲(干擾)。主要任務是測量文檔放置的傾斜角,對文檔進行版面分析,對選出的文字域進行排版確認,對橫、豎排版的文字行進行切分,每一行的文字圖像的分離,標點符號的判別等。這一階段的工做很是重要,處理的效果直接影響到文字識別的準確率。  版面分析是對文本圖像的整體分析,是將文檔中的全部文字塊分檢出來,區分出文本段落及排版順序,以及圖像、表格的區域。將各文字塊的域界(域在圖像中的始點、終點座標),域內的屬性(橫、豎排版方式)以及各文字塊的鏈接關係做爲一種數據結構,提供給識別模塊自動識別。對於文本區域直接進行識別處理,對於表格區域進行專用的表格分析及識別處理,對於圖像區域進行壓縮或簡單存儲。行字切分是將大幅的圖像先切割爲行,再從圖像行中分離出單個字符的過程。圖片

三、單字識別:單字識別是體現OCR文字識別軟件的核心技術。從掃描文本中分檢出的文字圖像,由計算機將其圖形、圖像轉變成文字的標準代碼,是讓計算機「認字」的關鍵,也就是所謂的識別技術。就像人腦認識文字是由於在人腦中已經保存了文字的各類特徵,如文字的結構、文字的筆畫等。要想讓計算機來識別文字,也須要先將文字的特徵等信息儲存到計算機裏,但要儲存什麼樣的信息及怎樣來獲取這些信息是一個很複雜的過程,並且要達到很是高的識別率才能符合要求。一般採用的作法是根據文字的筆畫、特徵點、投影信息、點的區域分佈等進行分析。文檔

上述這三個是圖片文字識別軟件ABBYY Finereader識別過程當中的技術原理,一些技術不成熟的軟件每個步驟都須要用戶手動進項操做,因此沒有必定的專業知識完成不了整個過程。而ABBYY FineReader圖片文字識別軟件由於技術成熟、智能化程度高,這些都是程序都是軟件自動完成,一鍵完成識別工做。get

相關文章
相關標籤/搜索