python 對以空行作爲分割的塊文件進行讀取的方法

時間 2021-01-07

原文原文鏈接

這幾天一直在處理數據，也接觸到了好幾款不一樣的庫，pandas雖然好用但是卻沒有直接處理空行分塊的txt文件，所以只能自己手寫腳本對文件進行分塊讀取，然後每一塊的信息存儲爲csv文件的一行。我處理的對象爲DBLP的數據集，地址是http://cn.aminer.org/citation 採用的是v1數據集。需要將形如#c，#！等分別代表的不同意思的信息提取出來數據的格式如下; 數據每塊的含義

>>阅读原文<<