python for dblp.xml

由於最近處理數據時涉及到dblp.xml,剛開始下載時dblp.xml只有300多M,但解壓之後就有1.9G,沒有什麼東西能夠打開,所以必須要用工具來處理,在python中sax包能夠一邊解析一邊處理XML數據 首先我們要知道dblp.xml裏面的數據是什麼格式的: 以下爲處理dplp.xml數據的代碼(以下爲我需要的數據,大家可以根據自己需要的數據來獲取數據): # -*-coding:utf-
相關文章
相關標籤/搜索