python在數據科學方面須要用到的庫:python
a。Numpy:科學計算庫。提供矩陣運算的庫。算法
b。Pandas:數據分析處理庫機器學習
c。scipy:數值計算庫。提供數值積分和常微分方程組求解算法。提供了一個很是普遍的特定函數集合。函數
d。Matplotlib:數據可視化庫學習
e。Scikit-learn:機器學習庫ip
安裝順序以下:ci
1.pip install numpy
2.pip install pandasget
3.pip install scipy數據分析
(sudo apt-get install libatlas-base-dev gfortran //這一步是後面安裝scipy所必需的. 備註:這個我沒有先安裝,直接就安裝scipy)
4.pip install matplotlib pandas
(安裝matplotlib以前首先安裝libpng。下載地址:http://pan.baidu.com/s/1o80C5Jk,解壓進入該文件夾,輸入python install setup.py。
安裝freetype,下載地址:http://pan.baidu.com/s/1dE5yvbr,解壓進入該文件夾,輸入python install setup.py。
對於freetype.tar.bz2的包,先進行安裝再解壓,命令:yum install bzip2,bunzip2 freetype-2.6.3.tar.bz2,tar -xvf freetype-2.6.3.tar)
5.pip install -U scikit-learn
建議用pip進行安裝。也能夠用yum安裝,apt-get安裝。可是pip安裝的包通常都比較新,因此建議用pip進行安裝。
其實numpy,pandas,scipy,matplotlib能夠直接下載一個anaconda就能夠了。
具體能夠看http://python.jobbole.com/86236/