python3爬蟲基礎-pyquery解析庫

簡介

看名稱和jQuery比較接近,對沒錯,pyQuery容許您對XML文檔進行jQuery查詢。API儘量相似於jQuery。pyquery使用lxml進行快速XML和html操做。支持CSS選擇器,操做在查找和操做HTML上是很是便捷的。html

安裝和使用

直接使用pip便可安裝python

pip install pyquery

URL初始化this

# -*- coding: utf-8 -*-
from pyquery import PyQuery as pq                           # 引入 pyquery 並設置別名
html_obj = pq('<html>this is test</html>')                  # html字符初始化對象
url_obj = pq(url='http://www.python.org',encoding='gbk')    # URL初始化對象
local_obj = pq(filename='test.html',encoding='gbk')         # 本地文件初始化對象

print(html_obj)                                             # 全部內容
print(url_obj('head'))                                      # 根據CSS標籤類型選擇
print(local_obj('#ID_01 .class_01 p'))                      # 根據CSS選擇器來選擇

==更多選擇器請參考博文==url

  • 《jQuery基礎 - 經常使用基本屬性》
  • 《jQuery基礎 - 選擇器》
  • 《jQuery基礎 - 篩選器》

官方文檔code

https://pyquery.readthedocs.io/en/latest/
相關文章
相關標籤/搜索