readme 下載VCForPython27.msi 安裝 https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi 安裝PIL 下載http://effbot.org/media/downloads/PIL-1.1.7.win32-py2.7.exe 安裝cv(本項目中沒有使用) pip install opencv-python 安裝pytesseract pip install pytesseract 安裝OCR 下載https://digi.bib.uni-mannheim.de/tesseract/ tesseract-ocr.zip 裏面包含chi_sim.traineddata 中文識別 把chi_sim.traineddata 放到安裝目錄E:\Program Files (x86)\Tesseract-OCR\tessdata ocr_home=ocr安裝目錄 tessdata_dir = join(ocr_home, 'tessdata') tessdata_dir_config = '--tessdata-dir "' + tessdata_dir + '"' # win ocr應用啓動絕對路徑 pytesseract.tesseract_cmd = join(ocr_home, 'tesseract.exe') #cfg.py 配置文件 #cut_img.py 切割原始圖片,生成name,id,score的目標圖片 #image_tools.py 圖片操做工具 #paser_image.py OCR解析圖片生成文本 #svm_features.py 生成須要識別的單個數字 #svm_predict.py 圖片預測 #svm_train.py 訓練模型並測試 #test.py 代碼實現的測試程序 libSVM 安裝 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載libsvm-3.22‑cp27-cp27m-win_amd64.whl pip install libsvm-3.22‑cp27-cp27m-win_amd64.whl(path 文件路徑) 將新生成的libsvm.dll複製到系統目錄(例如`C:WINDOWSsystem32')便可。 https://www.csie.ntu.edu.tw/~cjlin/libsvm/oldfiles/ 下載libsvm-3.22.zip 將壓縮包裏面的 __init__.py、svm.py、svmutil.py 存放到工程下面 SVM 數字圖片解析(本次model中不存在除噪) 步驟1. 原始文件存放到 data/image/origin 目錄下面 步驟2. 切割圖片中須要解析的name、id、score 分別存放於data/image/person_name、data/image/person_id、data/image/person_score 步驟3. 數字圖片切割成單個數字圖片做爲解析數據 在data/image/train 建立12個分類目錄,存放訓練數據 在data/image/test 建立12個分類目錄,存放測試數據 步驟4. 生成降維的訓練和測試文本 步驟5. 生成訓練模型 步驟6. 測試model準確度 步驟6. 預測圖片數值 參考資料: https://github.com/zhengwh/captcha-svm/blob/master/img_tools.py https://www.cnblogs.com/chimeiwangliang/p/7133308.html 學習資源: https://github.com/PatrickLib/captcha_recognize (捲曲神經網絡) https://github.com/leviome/lenet5_cnn_mnist 廖利偉