經常使用破解方法大體有如下幾種: php
1, 採集,去噪,二值化,濾波,調用Tesseract OCR,識別返回結果; java
java 代碼工程http://download.csdn.net/detail/ronghua_liu/6319701 程序員
2,微軟的東西Microsoft Office Document Imaging (MODI)作ocr識別。 c#
c#代碼工程http://download.csdn.net/detail/ronghua_liu/6319877 google
3, Asprise OCR,這個是商業的 spa
4,java ocr,這個沒用過。 .net
對於識別驗證碼的程序來講,最可貴部分是驗證字符的切割和特徵碼的創建,而國內不少程序員只作驗證碼時,老是喜歡在驗證碼加不少干擾素,干擾線,影響效果不說,還達不到很好的效果;因此,要想使本身驗證碼難於本識別,只作下面兩點就夠了
1 :字符粘連,最好全部的字符都有粘連的部分;
2 :不要使用規格字符,驗證碼的各個部分使用不一樣比例的縮放或者旋轉。
只要作到這兩點,或者這兩點的變形,識別程序就很難識別。咱們看看, yahoo 和 google 的驗證碼就知道,白字黑底,卻很難被識別。 blog
Goole: get
yahoo: it
碰到這種驗證碼,估計又夠嗆了。