urlparse主要是URL的分解和拼接,分析出URL中的各項參數,能夠被其餘的URL使用。python
主要的函數有:服務器
一、urlparse函數
將URL分解爲6個片斷,返回一個元組,包括協議、基地址、相對地址等等url
import urlparse url = urlparse.urlparse('http://blog.csdn.net/?ref=toolbar') print url
輸出結果爲:.net
ParseResult(scheme='http', netloc='blog.csdn.NET', path='/', params='', query='ref=toolbar', fragment='')blog
scheme是協議,netloc是服務器地址,path是相對路徑,params是參數,query是查詢的條件。字符串
若是知道服務器的地址的話,能夠以服務器的地址爲基地址,拼接其餘的相對路徑,組成新的URL。get
二、urlsplitit
和urlparse的做用差很少,將URL分解爲5個片斷,返回一個元組。返回一個包含5個字符串項目的元組:協議、位置、路徑、查詢、片斷。class
import urlparse url = urlparse.urlsplit('http://blog.csdn.net/?ref=toolbar') print url
運行結果爲:
SplitResult(scheme='http', netloc='blog.csdn.net', path='/', query='ref=toolbar', fragment='')
三、urljoin
基地址和相對地址的拼接。
urlparse.urljoin(base, url[, allow_fragments])
四、urlunparse
和urlparse的效果相反,能夠把6個部分拼接起來。