ABBYY圖片文字識別技術能夠用來作什麼

時間 2019-11-18

標籤 abbyy 圖片文字識別技術能夠來作什麼简体版

原文原文鏈接

圖片文字識別軟件ABBYY FineReader是如今辦公室的必備軟件，它能夠識別JPG、GIF、PNG、BMP、TIF和PDF源文件、PDF掃描件，也就是說咱們在平常工做中可以遇到的不能編輯的文字均可以經過ABBYY FineReader圖片文字識別軟件來識別，識別獲得的文字能夠自由的進行編輯。有不少人有這樣的疑問，圖片文字識別軟件的技術原理是什麼呢?數據結構

一、圖文輸入：是指經過輸入設備將文檔輸入到計算機中，也就是實現原稿的數字化。如今用得比較廣泛的設備是掃描儀。文檔圖像的掃描質量是OCR軟件正確識別的前提條件。恰當地選擇掃描分辨率及相關參數，是保證文字清楚、特徵不丟失的關鍵。此外，文檔儘量地放置端正，以保證預處理檢測的傾斜角小，在進行傾斜校訂後，文字圖像的變形就小。這些簡單的操做，會使系統的識別正確率有所提升。反之，因爲掃描設置不當，文字的斷筆過多可能會分檢出半個文字的圖像。文字斷筆和筆畫粘連會形成有些特徵丟失，在將其特徵與特徵庫比較時，會使其特徵距離加大，識別錯誤率上升。spa

二、預處理：掃描一幅簡單的印刷文檔的圖像，將每個文字圖像分檢出來交給識別模塊識別，這一過程稱爲圖像預處理。預處理是指在進行文字識別以前的一些準備工做，包括圖像淨化處理，去掉原始圖像中的顯見噪聲(干擾)。主要任務是測量文檔放置的傾斜角，對文檔進行版面分析，對選出的文字域進行排版確認，對橫、豎排版的文字行進行切分，每一行的文字圖像的分離，標點符號的判別等。這一階段的工做很是重要，處理的效果直接影響到文字識別的準確率。版面分析是對文本圖像的整體分析，是將文檔中的全部文字塊分檢出來，區分出文本段落及排版順序，以及圖像、表格的區域。將各文字塊的域界(域在圖像中的始點、終點座標)，域內的屬性(橫、豎排版方式)以及各文字塊的鏈接關係做爲一種數據結構，提供給識別模塊自動識別。對於文本區域直接進行識別處理，對於表格區域進行專用的表格分析及識別處理，對於圖像區域進行壓縮或簡單存儲。行字切分是將大幅的圖像先切割爲行，再從圖像行中分離出單個字符的過程。圖片

三、單字識別：單字識別是體現OCR文字識別軟件的核心技術。從掃描文本中分檢出的文字圖像，由計算機將其圖形、圖像轉變成文字的標準代碼，是讓計算機「認字」的關鍵，也就是所謂的識別技術。就像人腦認識文字是由於在人腦中已經保存了文字的各類特徵，如文字的結構、文字的筆畫等。要想讓計算機來識別文字，也須要先將文字的特徵等信息儲存到計算機裏，但要儲存什麼樣的信息及怎樣來獲取這些信息是一個很複雜的過程，並且要達到很是高的識別率才能符合要求。一般採用的作法是根據文字的筆畫、特徵點、投影信息、點的區域分佈等進行分析。文檔

上述這三個是圖片文字識別軟件ABBYY Finereader識別過程當中的技術原理，一些技術不成熟的軟件每個步驟都須要用戶手動進項操做，因此沒有必定的專業知識完成不了整個過程。而ABBYY FineReader圖片文字識別軟件由於技術成熟、智能化程度高，這些都是程序都是軟件自動完成，一鍵完成識別工做。get

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。