在使用Python強大的第三方庫nltk進行一些天然語言處理工做的時候遇到了一些困難,折騰一番總算解決。如今在這裏記錄一下,看成備忘。git
網上找到挺多安裝nltk的教程,但經測試,好像都是適用於Python2的,對於Python3,就勉爲其難了。這裏的主要問題是,前輩們分享的nltk_data包是不兼容Python3的。github
因此個人解決方案是:工具
到https://github.com/nltk/nltk_data下載gh-pages分支,裏面的Packages就是咱們要的資源。(注:截至2016年3月24日時本方案仍有效)測試
詳細狀況記錄以下:教程
1.安裝nltk。截至今天,安裝的是nltk3.2,在有pip這些工具的狀況下,安裝這些庫變得很是簡單:ip
pip install nltk資源
另外官方的安裝說明還附帶了numpy,一個「賽Matlab的Python開源的數值計算擴展庫」,說不定之後用得上:it
pip install numpypip