[學習筆記] [數據分析] 01.Python入門

一、安裝Python與環境配置python

數組

② 安裝pip以及利用pip安裝Python庫網絡

 

 

二、Anaconda安裝數據結構

 

conda list 要在root環境下機器學習

三、經常使用數據分析庫函數

① Numpypost

安裝:conda install numpy (conda在Anaconda上安裝,pip則是在本地上安裝)學習

提供經常使用的數值、數組、矩陣函數。優化

基於「向量化」的運算,進行數值運算時比list高。spa

② Scipy

安裝:conda install scipy

是一種使用NumPy來作高等數學、信號處理、優化、統計的擴展包

③ Pandas

安裝:conda install pandas

也是基於Numpy的擴展包,支持CSV文件輸入,整合時間序列,進行數據處理。

重要的數據結構:Series 和 DataFrame

具體操做:

顯示整個表格全部行:head(),展現表格第一行:head(1)

展現表格的一些屬性:

表格轉秩:

對錶格中某列進行排序:

④ Matplotlib

安裝:conda install matplotlib

seaborn庫

 

4、經常使用高級數據分析庫

①nltk (Natural Language Toolkit)

pip install -U nltk

import nltk

下載預料庫:nltk.download()

應用:文本提取、詞彙切分、詞頻分析、詞袋模型、情感分析

 

②igraph

研究社交網絡的數據和圖計算

pip install -U python-igraph

conda install -c marufr python-igraph=0.7.1.post6

 

③ scikit-learn

機器學習模型的訓練 

是創建在scipy之上的一個用於機器學習的Python模塊

pip install -U scikit-learn

conda install scikit-learn

 

5、Python2和Python3的區別

Python3的語言更加規範些

W3School Python 教程

相關文章
相關標籤/搜索