python 對以空行作爲分割的塊文件進行讀取的方法

這幾天一直在處理數據,也接觸到了好幾款不一樣的庫,pandas雖然好用但是卻沒有直接處理空行分塊的txt文件,所以只能自己手寫腳本對文件進行分塊讀取,然後每一塊的信息存儲爲csv文件的一行。我處理的對象爲DBLP的數據集,地址是http://cn.aminer.org/citation  採用的是v1數據集。 需要將形如#c,#!等分別代表的不同意思的信息提取出來 數據的格式如下; 數據每塊的含義
相關文章
相關標籤/搜索