python處理Excel數據串行串列問題

接到一個任務,要獲取藥監局所有的進口藥材,國產藥材名錄。寫好爬蟲,一共有十幾萬條的數據,爬下來一看,簡直不忍直視。各種串列,有的在第一行,有的在第三行,有的第五行,沒有任何規律可言。要想用Excel處理,難度很大啊,所以就寫了python腳本來處理了。 思路是這樣的: 1.用python讀取整行的數據 2.把一整行的數據連成一個字符串 3.找出規律(比如表中每一行都有幾個關鍵字,如藥品本位碼:這幾
相關文章
相關標籤/搜索