數據清洗一:

   原數據格式:    轉換的目標格式:   腳本目的:轉換數據的格式,屬於數據清洗部分。 腳本邏輯,將文件讀取後,將第一列設置爲key,第三列設爲列表組成的value,建立dict;然後循環dict來統計items兩兩之間重複的id以及其數目。 #!/usr/bin/python import sys import pandas as pd f1=sys.argv[1] f2=sys.argv
相關文章
相關標籤/搜索