urllib
中經常使用方法的介紹一、urlopen
網絡請求html
urlopen
方法是網絡請求的方法,默認是get
請求,若是傳遞了data
是post
請求python
from urllib import request
if __name__ == "__main__":
response = request.urlopen('http://www.baidu.com')
print(response.read())
複製代碼
二、urlretrieve
下載文件網絡
from urllib import request
if __name__ == "__main__":
# 下載整個網頁
request.urlretrieve('http://www.baidu.com', 'baidu.html')
# 下載圖片
request.urlretrieve('http://www.baidu.com/img/bd_logo1.png', 'baidu.png')
複製代碼
一、urlencode
將字典類型數據轉換爲parsed
模式post
from urllib import parse
if __name__ == "__main__":
dict1 = {
"name": "hello",
"age": "20",
"gender": "man"
}
re = parse.urlencode(dict1)
print(re) # name=hello&age=20&gender=man
複製代碼
二、parse_qs
和parse_qsl
反序列化編碼
from urllib import parse
if __name__ == "__main__":
dict1 = {
"name": "hello",
"age": "20",
"gender": "man"
}
re = parse.urlencode(dict1)
print(re)
print(parse.parse_qs(re))
複製代碼
url
的方法一、urlsplit
和urlparse
方法url
from urllib import request, parse
if __name__ == "__main__":
url = 'http://www.baidu.com?name=hello&age=20'
print(parse.urlsplit(url))
print(parse.urlparse(url))
# 輸出
# SplitResult(scheme='http', netloc='www.baidu.com', path='', query='name=hello&age=20', fragment='')
# ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='name=hello&age=20', fragment='')
複製代碼
python
爬蟲文章能夠訪問