最近在用Python作中文天然語言處理。使用的IDE是PyCharm。PyCharm確實是Python開發之首選,但用於科學計算方面,還略有欠缺。爲此我嘗試過Enthought Canopy,但Canopy感受把問題搞得複雜化,管理Python擴展也不太方便。直到今天我發現了Anaconda。
Anaconda是一個和Canopy相似的科學計算環境,但用起來更加方便。自帶的包管理器conda也很強大。
首先是下載安裝。Anaconda提供了Python2.7和Python3.4兩個版本,同時若是須要其餘版本,還能夠經過conda來建立。安裝完成後能夠看到,Anaconda提供了Spyder,IPython和一個命令行。下面來看一下conda。
輸入conda list
來看一下全部安裝時自帶的Python擴展。粗略看了一下,其中包括了經常使用的 Numpy
,Scipy
,matplotlib
和networkx
等,以及beautiful-soup
,requests
,flask
,tornado
等網絡相關的擴展。
奇怪的是,裏邊居然沒有sklearn
,因此首先裝一下它。python
conda install scikit-learn
若是須要指定版本,也能夠直接用[package-name]=x.x
來指定。
conda的repo中的擴展不算太新,若是想要更新的,可能要用PyPI或者本身下載源碼。而conda和pip關聯的很好。使用pip安裝的東西可使用conda來管理,這點要比Canopy好。下圖是我用pip安裝的nltk
,jieba
和gensim
。flask
我對這個科學計算環境的另外一個要求就是可以多個Python版本並存,尤爲是2.x和3.x的並存。這個經過virtualenv
能夠作到。Anaconda也正是經過其實現的。
下面用conda建立一個名叫python2的版本爲python2.7的環境。segmentfault
conda create -n python2 python=2.7
這樣就會在Anaconda安裝目錄下的envs目錄下建立python2這個目錄。
向其中安裝擴展能夠:網絡
conda install
並用-n
指明安裝到的環境,這裏天然就是python2
。virtualenv
那樣,先activate,而後在虛擬環境中安裝。這裏忽然有一個問題,怎樣在IDE中使用建立出來的環境?若是是PyCharm等IDE,直接設置Python安裝目錄就能夠了。那spyder呢?其實spyder就是一個Python的擴展,你須要在虛擬環境中也裝一個spyder。
最後就是spyder的主界面。變量查看窗口很好用。python2.7