Python數據分析基礎 高清完整版免費下載Python基礎教程免費電子書

點擊獲取書籍提取碼:eup7

內容提要

本書展現如何用Python程序將不一樣格式的數據處理和分析任務規模化和自動化。主要內容 包括: Python基礎知識介紹、CSV文件和Excel文件讀寫、數據庫的操做。示例程序演示,圖 表的建立,等等。
本書適合數據分析與處理工做相關人員。正則表達式

做者簡介 · · · · · ·

Clinton W. Brownleysql

博士,Facebook數據科學家,負責大數據流水線、統計建模和數據可視化項目,併爲大型基礎設施建設提供數據驅動的決策建議。數據庫

目錄 · · · · · ·

前言  xi
第1章 Python 基礎  1
1.1 建立 Python 腳本  1
1.2 運行 Python 腳本  3
1.3 與命令行進行交互的幾項技巧  6
1.4 Python 語言基礎要素  10
1.4.1 數值  10
1.4.2 字符串  12
1.4.3 正則表達式與模式匹配  16
1.4.4 日期  19
1.4.5 列表  21
1.4.6 元組  26
1.4.7 字典  27
1.4.8 控制流  30
1.5 讀取文本文件  35
1.5.1 建立文本文件  36
1.5.2 腳本和輸入文件在同一位置  38
1.5.3 讀取文件的新型語法  38
1.6 使用 glob 讀取多個文本文件  39
1.7 寫入文本文件  42
1.7.1 向 first_script.py 添加代碼  42
1.7.2 寫入 CSV 文件  45
1.8 print 語句  46
1.9 本章練習  47
第2章 CSV文件  48
2.1 基礎 Python 與 pandas  50
2.1.1 讀寫 CSV 文件(第1 部分)50
2.1.2 基本字符串分析是如何失敗的  56
2.1.3 讀寫 CSV 文件(第2 部分)57
2.2 篩選特定的行  58
2.2.1 行中的值知足某個條件  59
2.2.2 行中的值屬於某個集合  60
2.2.3 行中的值匹配於某個模式/ 正則表達式  62
2.3 選取特定的列  64
2.3.1 列索引值  64
2.3.2 列標題  65
2.4 選取連續的行  67
2.5 添加標題行  69
2.6 讀取多個 CSV 文件  71
2.7 從多個文件中鏈接數據  75
2.8 計算每一個文件中值的總和與均值  78
2.9 本章練習  81
第3章 Excel 文件  82
3.1 內省 Excel 工做簿  84
3.2 處理單個工做表  88
3.2.1 讀寫 Excel 文件  88
3.2.2 篩選特定行  92
3.2.3 選取特定列  98
3.3 讀取工做簿中的全部工做表  101
3.3.1 在全部工做表中篩選特定行  102
3.3.2 在全部工做表中選取特定列  104
3.4 在 Excel 工做簿中讀取一組工做表  106
3.5 處理多個工做簿  108
3.5.1 工做表計數以及每一個工做表中的行列計數  110
3.5.2 從多個工做簿中鏈接數據  111
3.5.3 爲每一個工做簿和工做表計算總數和均值  113
3.6 本章練習  117
第4章 數據庫  118
4.1 Python 內置的 sqlite3 模塊  119
4.1.1 向表中插入新記錄  124
4.1.2 更新表中記錄  128
4.2 MySQL 數據庫  131
4.2.1 向表中插入新記錄  135
4.2.2 查詢一個表並將輸出寫入 CSV 文件  140
4.2.3 更新表中記錄  142
4.3 本章練習  146
第5章 應用程序  147
5.1 在一個大文件集合中查找一組項目  147
5.2 爲 CSV 文件中數據的任意數目分類計算統計量  158
5.3 爲文本文件中數據的任意數目分類計算統計量  167
5.4 本章練習  174
第6章 圖與圖表  175
6.1 matplotlib  175
6.1.1 條形圖  175
6.1.2 直方圖  177
6.1.3 折線圖  178
6.1.4 散點圖  180
6.1.5 箱線圖  181
6.2 pandas  183
6.3 ggplot  184
6.4 seaborn  186
第7章 描述性統計與建模  192
7.1 數據集  192
7.1.1 葡萄酒質量  192
7.1.2 客戶流失  193
7.2 葡萄酒質量  194
7.2.1 描述性統計  194
7.2.2 分組、直方圖與 t 檢驗  195
7.2.3 成對變量之間的關係和相關性  196
7.2.4 使用最小二乘估計進行線性迴歸  198
7.2.5 係數解釋  200
7.2.6 自變量標準化  200
7.2.7 預測  202
7.3 客戶流失  203
7.3.1 邏輯斯蒂迴歸  205
7.3.2 係數解釋  207
7.3.3 預測  208
第8章 按計劃自動運行腳本  209
8.1 任務計劃程序(Windows 系統)209
8.2 cron 工具(macOS 系統和 Unix 系統)215
8.2.1 cron 表文件:一次性設置  216
8.2.2 向 cron 表文件中添加 cron 任務  216
第9章 從這裏啓航  220
9.1 更多的標準庫模塊和內置函數  221
9.1.1 Python 標準庫(PSL):更多的標準模塊  221
9.1.2 內置函數  222
9.2 Python 包索引(PyPI):更多的擴展模塊  222
9.2.1 NumPy  223
9.2.2 SciPy  227
9.2.3 Scikit-Learn  230
9.2.4 更多的擴展包  232
9.3 更多的數據結構  232
9.3.1 棧  233
9.3.2 隊列  233
9.3.3 圖  233
9.3.4 樹  234
9.4 從這裏啓航  234
附錄A 下載指南  236
附錄B 練習答案  245
做者介紹  247
封面介紹  247數據結構

相關文章
相關標籤/搜索