readme.txt

readme
下載VCForPython27.msi 安裝
https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi
安裝PIL
下載http://effbot.org/media/downloads/PIL-1.1.7.win32-py2.7.exe
安裝cv(本項目中沒有使用)
pip install opencv-python
安裝pytesseract
pip install pytesseract
安裝OCR
下載https://digi.bib.uni-mannheim.de/tesseract/
tesseract-ocr.zip  裏面包含chi_sim.traineddata 中文識別
把chi_sim.traineddata 放到安裝目錄E:\Program Files (x86)\Tesseract-OCR\tessdata
ocr_home=ocr安裝目錄
tessdata_dir = join(ocr_home, 'tessdata')
tessdata_dir_config = '--tessdata-dir "' + tessdata_dir + '"'
# win ocr應用啓動絕對路徑
pytesseract.tesseract_cmd = join(ocr_home, 'tesseract.exe')

#cfg.py                     配置文件
#cut_img.py                 切割原始圖片,生成name,id,score的目標圖片
#image_tools.py             圖片操做工具
#paser_image.py             OCR解析圖片生成文本
#svm_features.py            生成須要識別的單個數字
#svm_predict.py             圖片預測
#svm_train.py               訓練模型並測試
#test.py                    代碼實現的測試程序

libSVM 安裝
https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載libsvm-3.22‑cp27-cp27m-win_amd64.whl
pip install libsvm-3.22‑cp27-cp27m-win_amd64.whl(path 文件路徑)
將新生成的libsvm.dll複製到系統目錄(例如`C:WINDOWSsystem32')便可。
https://www.csie.ntu.edu.tw/~cjlin/libsvm/oldfiles/ 下載libsvm-3.22.zip
將壓縮包裏面的 __init__.py、svm.py、svmutil.py 存放到工程下面

SVM 數字圖片解析(本次model中不存在除噪)
步驟1.
    原始文件存放到 data/image/origin 目錄下面
步驟2.
    切割圖片中須要解析的name、id、score
   分別存放於data/image/person_name、data/image/person_id、data/image/person_score
步驟3.
    數字圖片切割成單個數字圖片做爲解析數據
    在data/image/train 建立12個分類目錄,存放訓練數據
   在data/image/test  建立12個分類目錄,存放測試數據
步驟4.
    生成降維的訓練和測試文本
步驟5.
    生成訓練模型
步驟6.
   測試model準確度
步驟6.
   預測圖片數值


參考資料:
    https://github.com/zhengwh/captcha-svm/blob/master/img_tools.py
    https://www.cnblogs.com/chimeiwangliang/p/7133308.html

學習資源:
https://github.com/PatrickLib/captcha_recognize (捲曲神經網絡)
https://github.com/leviome/lenet5_cnn_mnist 廖利偉
相關文章
相關標籤/搜索