python 爬蟲登錄學校教務系統之驗證碼識別

在網上看了下,驗證碼識別的內容,發現基本有兩種思路,一是利用ocr,這方面有google的開源庫tesseract-ocr,另外一種是利用機器學習,抓取大量圖片,通過處理,獲得單個字符的training-data來進行匹配識別,本質上是一種方法,不過tesseract-ocr幫咱們作好了training-data,咱們只須要調用就行了,固然,google文檔裏寫到咱們也能夠自定義的向tessera
相關文章
相關標籤/搜索