記錄安裝Python第三方包「tesserocr」的方法和遇到的坑

1. 環境:html

系統環境:Win7 32 位系統windows

Python版本: 3.6.5        虛擬環境爲:Miniconda3測試

2. 共須要安裝的模塊:ui

a. tesserocr spa

b. tesseract.net

c. PIL翻譯

3. 安裝方法:3d

個人安裝順序爲:b -> a -> c代理

其實安裝最爲麻煩,報錯最多的模塊是tesserocr,我嘗試瞭如下這些命令:code

pip install tesserocr

pip3 install tesserocr

conda install tesserocr

conda install -c simonflueckiger tesserocr

前三個根本就是不行

最後一個確實是能找到tesserocr的資源,可是根本就下不動,我估計要是掛代理下載的話也許能行,有條件的能夠試試。

最後個人解決辦是參照了這篇博客win7系統安裝tesseract及tesserocr 中所講的方法,在網上下載了 tesserocr-2.4.0-cp36-cp36m-win32.whl 這個.whl文件來安裝,很好,安裝的很順利。其中須要注意的是當你執行pip install tesserocr-2.4.0-cp36-cp36m-win32.whl 這條命令的時候,若是你沒把你下載下來的.whl文件放在正確的文件目錄下的話,這條語句會報錯,提示你:tesserocr-2.4.0-cp36-cp36m-win32.whl彷佛是一個文件名,可是在巴拉巴拉目錄下沒有該文件(固然人家是英文報錯,我給你翻譯了),那就好辦了,那就根據它的提示把該.whl文件放在它提示的文件目錄下就行了。

而後再說一下 關於 tesserocr 和 tesseract 版本匹配的問題一開始我並不瞭解該怎麼裝這些東西,因此在下載tesseract的時候(下載地址也參考我前文提到的博客)我就下載了最新的tesseract版本(tesseract-ocr-w32-setup-v5.0.0-alpha.20191030),心想確定是最新的版本最厲害嘛,而後發現網上好多人說tesserocr的版本要和tesseract的版本匹配,以下圖:

 

可是我在安裝 tesseract-ocr-w32-setup-v5.0.0-alpha.20191030 時真的是用了很長時間,這個的安裝方法也參考我前文提到的博客。我是真的不想再去卸載掉而後下載個tesserocr v2.4.0版再浪費好幾個小時安裝一遍,因此我就抱着嘗試的心態,嘗試了一下,我發現

測試代碼:

1 import tesserocr
2 from PIL import Image
3 
4 image = Image.open('image.png')
5 print(tesserocr.image_to_text(image))

運行結果:

 

沒想到它居然能運行成功!!!

這兩個版本聽說不符的傢伙居然被我給撮合到一塊兒了???

 

那行吧,反正不報錯最好啦~

最後再說一下關於 安裝 pillow 遇到的報錯

就是在Anaconda Promote中執行這條語句時:pip install pillow 報錯了:Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL。

這個的解決方案參考這篇博客:【Python】Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL 按照他的解決方案解決便可。

 

最後的最後,出了文中提到的幾篇博客以外,我以爲還有幾篇講得不錯的博客推薦給你們,安裝方法就不用過多關注了,按照個人方法來大家確定能把環境搭起來了,這幾篇博客就供你們取材用吧。

1. Python tesserocr模塊使用示例

2. tesserocr最新版本2.4.0安裝(windows)

3. 爬蟲如何解決圖片驗證碼問題

相關文章
相關標籤/搜索