100天搞定機器學習|day45-53 推薦一本豆瓣評分9.3的書:《Python數據科學手冊》

file《Python數據科學手冊》共五章,每章介紹一到兩個Python數據科學中的重點工具包。首先從IPython和Jupyter開始,它們提供了數據科學家須要的計算環境;第2章講解能提供ndarray對象的NumPy,它能夠用Python高效地存儲和操做大型數組;第3章主要涉及提供DataFrame對象的Pandas,它能夠用Python高效地存儲和操做帶標籤的/列式數據;第4章的主角是Matplotlib,它爲Python提供了許多數據可視化功能;第5章以Scikit-Learn爲主,這個程序庫爲最重要的機器學習算法提供了高效整潔的Python版實現。git

本書主要框架:github

第2章:NumPy介紹算法

2.1 理解Python中的數據類型數組

2.2 NumPy數組基礎微信

2.3 NumPy數組的計算:通用函數框架

2.4 聚合:最小值、最大值和其餘值機器學習

2.5 數組的計算:廣播函數

2.6 比較、掩碼和布爾運算工具

2.7 花哨的索引性能

2.8 數組的排序

2.9 結構化數據:NumPy的結構化數組

3 Pandas數據處理

3.1 Pandas對象簡介

3.2 數據取值與選擇

3.3 Pandas數值運算方法

3.4 處理缺失值

3.5 層級索引

3.6 合併數據集:ConCat和Append方法

3.7 合併數據集:合併與鏈接

3.8 累計與分組

3.9 數據透視表

3.10 向量化字符串操做

3.11 處理時間序列

3.12 高性能Pandas:eval()與query()

4 Matplotlib數據可視化

4.1 簡易線形圖

4.2 簡易散點圖

4.3 可視化異常處理

4.4 密度圖與等高線圖

4.5 直方圖

4.6 配置圖例

4.7 配置顏色條

4.8 多子圖

4.9 文字與註釋

4.10 畫三維圖

中文版下載地址:

https://github.com/MachineLearning100/100-Days-Of-ML-Code/blob/master/Other%20Docs/Python數據科學手冊.zip

代碼及案例:

https://github.com/jakevdp/PythonDataScienceHandbook

首發於微信公衆號:機器學習與統計學
![歡迎掃碼關注,領取海量資料][1]

[1]: https://img2018.cnblogs.com/blog/743008/201907/743008-20190725101305454-1314391880.png

相關文章
相關標籤/搜索