python的urlparse

urlparse主要是URL的分解和拼接,分析出URL中的各項參數,能夠被其餘的URL使用。python

主要的函數有:服務器

一、urlparse函數

將URL分解爲6個片斷,返回一個元組,包括協議、基地址、相對地址等等url

import urlparse  
url = urlparse.urlparse('http://blog.csdn.net/?ref=toolbar')  
print url  

輸出結果爲:.net

ParseResult(scheme='http', netloc='blog.csdn.NET', path='/', params='', query='ref=toolbar', fragment='')blog

scheme是協議,netloc是服務器地址,path是相對路徑,params是參數,query是查詢的條件。字符串

若是知道服務器的地址的話,能夠以服務器的地址爲基地址,拼接其餘的相對路徑,組成新的URL。get

二、urlsplitit

和urlparse的做用差很少,將URL分解爲5個片斷,返回一個元組。返回一個包含5個字符串項目的元組:協議、位置、路徑、查詢、片斷。class

import urlparse  
url = urlparse.urlsplit('http://blog.csdn.net/?ref=toolbar')  
print url  

運行結果爲:

SplitResult(scheme='http', netloc='blog.csdn.net', path='/', query='ref=toolbar', fragment='')

三、urljoin

基地址和相對地址的拼接。

urlparse.urljoin(base, url[, allow_fragments])

四、urlunparse

和urlparse的效果相反,能夠把6個部分拼接起來。

相關文章
相關標籤/搜索