Python爬取網站數據

編碼問題 由於涉及到中文,因此必然地涉及到了編碼的問題,這一次借這個機會算是完全搞清楚了。html 問題要從文字的編碼講起。本來的英文編碼只有0~255,恰好是8位1個字節。爲了表示各類不一樣的語言,天然要進行擴充。中文的話有GB系列。可能還據說過Unicode和UTF-8,那麼,它們之間是什麼關係呢?python Unicode是一種編碼方案,又稱萬國碼,可見其包含之廣。可是具體存儲到計算機上,
相關文章
相關標籤/搜索