tesseract-ocr的安裝及使用

OCR (Optical Character Recognition,光學字符識別),是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程。目前出現很多OCR技術(tesseract-ocr 、百度、騰訊、阿里等有推出OCR技術),但是老的OCR技術還是要了解下,最主要的是tesseract-ocr 開源。 目錄 1
相關文章
相關標籤/搜索