Python3下的NLTK及nltk_data安裝問題(Ubuntu環境)

在使用Python強大的第三方庫nltk進行一些天然語言處理工做的時候遇到了一些困難,折騰一番總算解決。如今在這裏記錄一下,看成備忘。git

 

 

 

網上找到挺多安裝nltk的教程,但經測試,好像都是適用於Python2的,對於Python3,就勉爲其難了。這裏的主要問題是,前輩們分享的nltk_data包是不兼容Python3的。github

 

 

 

因此個人解決方案是:工具

 

到https://github.com/nltk/nltk_data下載gh-pages分支,裏面的Packages就是咱們要的資源。(注:截至2016年3月24日時本方案仍有效)測試

 

 

 

詳細狀況記錄以下:教程

 

1.安裝nltk。截至今天,安裝的是nltk3.2,在有pip這些工具的狀況下,安裝這些庫變得很是簡單:ip

 

pip install nltk資源

 

另外官方的安裝說明還附帶了numpy,一個「賽Matlab的Python開源的數值計算擴展庫」,說不定之後用得上:it

 

pip install numpypip

相關文章
相關標籤/搜索