《Python數據科學手冊》共五章,每章介紹一到兩個Python數據科學中的重點工具包。首先從IPython和Jupyter開始,它們提供了數據科學家須要的計算環境;第2章講解能提供ndarray對象的NumPy,它能夠用Python高效地存儲和操做大型數組;第3章主要涉及提供DataFrame對象的Pandas,它能夠用Python高效地存儲和操做帶標籤的/列式數據;第4章的主角是Matplotlib,它爲Python提供了許多數據可視化功能;第5章以Scikit-Learn爲主,這個程序庫爲最重要的機器學習算法提供了高效整潔的Python版實現。git
本書主要框架:github
第2章:NumPy介紹算法
2.1 理解Python中的數據類型數組
2.2 NumPy數組基礎微信
2.3 NumPy數組的計算:通用函數框架
2.4 聚合:最小值、最大值和其餘值機器學習
2.5 數組的計算:廣播函數
2.6 比較、掩碼和布爾運算工具
2.7 花哨的索引性能
2.8 數組的排序
2.9 結構化數據:NumPy的結構化數組
3 Pandas數據處理
3.1 Pandas對象簡介
3.2 數據取值與選擇
3.3 Pandas數值運算方法
3.4 處理缺失值
3.5 層級索引
3.6 合併數據集:ConCat和Append方法
3.7 合併數據集:合併與鏈接
3.8 累計與分組
3.9 數據透視表
3.10 向量化字符串操做
3.11 處理時間序列
3.12 高性能Pandas:eval()與query()
4 Matplotlib數據可視化
4.1 簡易線形圖
4.2 簡易散點圖
4.3 可視化異常處理
4.4 密度圖與等高線圖
4.5 直方圖
4.6 配置圖例
4.7 配置顏色條
4.8 多子圖
4.9 文字與註釋
4.10 畫三維圖
中文版下載地址:
https://github.com/MachineLearning100/100-Days-Of-ML-Code/blob/master/Other%20Docs/Python數據科學手冊.zip
代碼及案例:
https://github.com/jakevdp/PythonDataScienceHandbook
首發於微信公衆號:機器學習與統計學
![歡迎掃碼關注,領取海量資料][1]
[1]: https://img2018.cnblogs.com/blog/743008/201907/743008-20190725101305454-1314391880.png