RPA之眼:AI-OCR,Fax-OCR概述

文丨馬磊html

OCR是一種與RPA機器人協做的一項重要技術,至關於機器人的眼睛。機器學習

OCR是英文「Optical Character Recognition/Reader」的簡稱,光學字符識別。從名字咱們不難看出,OCR就是讀取手寫和印刷文字,並把讀取的信息轉換成能夠在電腦的Excel,World等軟件上使用的文字信息處理技術。學習

 當前的信息化社會,大量的文件被電子化,紙質的文件愈來愈少。但事實上依然存在不少不得不使用紙質文件的狀況,好比說街頭調查問卷。OCR技術的誕生能夠取代人工讀取紙質文件的工做,並將紙質文件的信息電子化。ui

RPA之眼:AI-OCR,Fax-OCR概述

RPA和OCR的協做

RPA目前活躍在以金融機關表明的企業中,可是這些企業的紙質媒體和打印數據等非電子化的數據僅僅依靠RPA來進行業務處理的話仍是至關困難的。這就爲RPA技術與OCR技術的協同合做提供了契機。htm

在只有RPA的狀況下,須要員工手動把紙質文件的信息錄入到Excel,Word等電子文檔中,而後運行RPA機器人讀取電子文檔中的信息實現業務的自動化處理。對象

而RPA + OCR的狀況下,只需實現掃描好紙質文件,OCR會自動讀取掃描文件,將圖片信息讀取並寫入Excel等文檔中,而後RPA機器人運行,進行業務處理。這個過程徹底替代了人工手動錄入,極大地節約了人力成本。blog

RPA之眼:AI-OCR,Fax-OCR概述

近年來, OCR引發了普遍關注,但目前的OCR軟件存在精度不高和沒法應對非固定文件模板等課題。將來經過在OCR中引入AI的深度機器學習等技術之後,相信必定會解決這個課題。圖片

Fax-OCR是什麼?

RPA之眼:AI-OCR,Fax-OCR概述

Fax-OCR是把傳真機接收的訂單等紙質文件經過OCR技術自動轉爲文本信息的技術。雖然說如今社會尤爲是國內公司,不少都是網上接單了,可是用傳真接收客戶訂單這種古老的方式仍是在必定程度上存在的。尤爲是日本的小型公司依然採用這種老舊的接收訂單的方式。若是把傳真資料自動讀入系統將減小大量人工錄入的費時操做,同時人工失誤也會大幅減小。文檔

OCR的注意點

OCR技術確實能夠自動實現數據的文本化,也是一項很是有效的效率改善的技術手段,可是如今的階段OCR並不是無所不能。get

一、沒法對應多份文件。

通常來講,OCR 須要讀取文本內容以及文件內容的模板,並定義好抽出的對象數據的位置。可是,因爲客戶的文件模板並不統一,文件模板和數據座標位置也不盡相同,這種狀況應對起來就比較困難了。因此對於一些既有模板之外的文件要格外注意。

二、文字數據抽出後,必須進行人工確認。

雖然AI-OCR能夠經過機器學習技術去識別手寫文字,可是不少不清楚,或者寫法不鮮明的文字仍是很難作到完美識別。所以,數據抽出完畢後仍是要經過人去確認數據的正確性。

原文地址:https://www.uibot.com.cn/news-7-1307.html

相關文章
相關標籤/搜索