Python 學習資料推薦

本人業餘寫python爬蟲、python小工具已有兩年有餘了,在這裏推薦一些學習時以爲比較好的視頻教程、文章教程等,純屬我的建議,不喜勿噴css

目錄

資料篇

自學最好的仍是動手操做,想用什麼找什麼,語法文章推薦Python3菜鳥教程 視頻教學中國大學MOOC,我的比較偏好嵩天老師的課程,有不少課程涉及到了Python語言程序設計、Python網絡爬蟲與信息提取、Python數據分析與展現、Python科學計算三維可視化等,能夠說很全嵩天老師全部課程 ,其次視頻推薦莫煩Python,裏面有文章介紹和視頻介紹,別人偏向與文章介紹,這樣更快更節省時間html

爬蟲篇

介紹一下爬蟲涉及到的第三方庫及其相關文檔python

  1. urllib3
  2. urllib3文檔
  3. Requests文檔
  4. Beautiful Soup英文版
  5. Beautiful Soup中文版
  6. 正則表達式
  7. scrapy
  8. scrapy文檔
  9. css選擇器語法
  10. re正則表達式語法
  11. xpath語法
  12. PyMySQL
  13. PyMySQL文檔

數據分析篇

數據分析的第三方庫介紹mysql

  1. Blaze
  2. Open Mining
  3. Orange
  4. Pandas
  5. Optimus
  6. NumPy

附上github上python不一樣用途的第三方庫的總價awesome-pythongit

css選擇器語法

表達式                          說明
*                              選擇全部節點
#container 選擇id爲container的節點
.container                     選取全部class包含container的節點
li a                           選取全部li下的全部a節點
ul + p                         選擇ul後面的第一個p元素
div#container > ul 選取id爲container的div的第一個ul子元素

ul ~ p                         選取與ul相鄰的全部p元素
a[title]                       選取全部有title屬性的a元素
a[href="http://baidu.com"]     選取全部href屬性爲http://baidu.com值的a元素
a[href*="baidu"]               選取全部href屬性包含baidu的a元素
a[href^="http"]                選取全部href屬性值以http開頭的a元素
a[href$=".jpg"]                選取全部href屬性值以.jpg結尾的a元素
input[type=radio]:checked      選擇選中的radio的元素

div:not(#container) 選取全部id非container的div屬性
li:nth-child(3)                選取第三個li元素
tr:nth-child(2n)               第偶數個tr

[css視頻介紹](http://www.w3school.com.cn/css/css_selector_type.asp)
複製代碼

re正則表達式語法

字符                     匹配
.                       任意字符(除了\n)
[...]                   字符集
\d/\D                   數字/非數字
\s/\S                   空白/非空白
\w/\W                   單詞字符[a-zA-Z0-9]/非單詞字符
*                       前一個字符0次或者無限次
+                       前一個字符1次或者無限次
?                       前一個字符0次或者一次
{m}/{m,n}               前一個字符m次或者n次
*?/+?/??                非貪婪(儘量少匹配字符)
^                       字符串開頭
$                       字符串結尾
\A/\Z                   指定的字符串必須出如今開頭/結尾
|                       匹配左右任意一個表達式
(ab)                    括號中表達式做爲一個分組
\<number>               引用編號爲num的分組匹配到的字符串
(?P<name>)              分組起一個別名
(?P=name)               引用別名爲name的分組匹配字符串
[\u4E00-\u9FA5]         一個漢字
複製代碼

xpath語法

表達式                     說明
article                   選取全部article元素的全部子節點
/article                  選取跟元素article
article/a                 選取全部屬於article的子元素的a元素
//div                     選取全部div子元素(不論出如今文檔任何地方)
article//div              選取全部輸入article元素的後代的div元素,無論它出如今article之下的任何位置
//@class                  選取全部名爲class的屬性

/article/div[1]           選取屬於article子元素的第一個div元素
/article/div[last()]      選取輸入article子元素的最後一個div元素
/article/div[last()-1]    選取屬於article子元素的倒數第二個div元素
//div[@lang]              選取全部擁有lang屬性的div元素
//div[@lang='eng] 選取全部lang屬性爲eng的div元素 /div/* 選取屬於div元素的全部子節點 //* 選取全部元素 //div[@*] 選取全部帶屬性的title元素 //div/a|//div/p 選取全部div元素的a和p元素 //span|//ul 選取文檔中的span和ul元素 article/div/p|//span 選取全部屬於article元素的div元素的p元素以及文檔中全部的span元素 複製代碼
相關文章
相關標籤/搜索