一、安裝Python與環境配置python
①數組
② 安裝pip以及利用pip安裝Python庫網絡
二、Anaconda安裝數據結構
conda list 要在root環境下機器學習
三、經常使用數據分析庫函數
① Numpypost
安裝:conda install numpy (conda在Anaconda上安裝,pip則是在本地上安裝)學習
提供經常使用的數值、數組、矩陣函數。優化
基於「向量化」的運算,進行數值運算時比list高。spa
② Scipy
安裝:conda install scipy
是一種使用NumPy來作高等數學、信號處理、優化、統計的擴展包
③ Pandas
安裝:conda install pandas
也是基於Numpy的擴展包,支持CSV文件輸入,整合時間序列,進行數據處理。
重要的數據結構:Series 和 DataFrame
具體操做:
顯示整個表格全部行:head(),展現表格第一行:head(1)
展現表格的一些屬性:
表格轉秩:
對錶格中某列進行排序:
④ Matplotlib
安裝:conda install matplotlib
seaborn庫
4、經常使用高級數據分析庫
①nltk (Natural Language Toolkit)
pip install -U nltk
import nltk
下載預料庫:nltk.download()
應用:文本提取、詞彙切分、詞頻分析、詞袋模型、情感分析
②igraph
研究社交網絡的數據和圖計算
pip install -U python-igraph
conda install -c marufr python-igraph=0.7.1.post6
③ scikit-learn
機器學習模型的訓練
是創建在scipy之上的一個用於機器學習的Python模塊
pip install -U scikit-learn
conda install scikit-learn
5、Python2和Python3的區別
Python3的語言更加規範些
W3School Python 教程