在進行數據分析時,免不了要用到pandas庫,網上關於pandas的操做說明已是很全了,在這裏再也不贅述。程序員
我將記錄一下今天下午在進行數據集的讀取時,遇到的一些小問題,進行相關的記錄,望後來者再也不犯相同的錯誤,也是給本身的一個小小的總結。工具
1.(.csv)文件;3d
2.工具:Jupyter Notebook(簡稱jp) ,Pycharm(簡稱pc);code
3.使用anconda中的pandas庫;對象
1、問題描述blog
當我在利用jp進行.csv文件的讀取時出現了下面這種現象:utf-8
這個實際上是很常見的問題,那是由於咱們經常會忘記先執行以前的代碼,而是先執行了後面的代碼,致使pandas庫其實是沒有被import的。pycharm
很快我也發現了這個問題,這都是粗心致使的,小夥伴們須要警戒這些小錯誤!cmd
這個問題被解決了,不幸的是,出現了另外一個問題,以下圖所示:編譯器
看到這一長串錯誤,做爲一個上手沒多久的小白來講內心不免會心慌,這問題處在哪裏呢?
2、思考錯誤來源
強行讓本身冷靜下來,想想我在這些操做中哪裏會出現問題?百度了一番,我有如下3個懷疑對象:
1.代碼寫錯了?(不可能啊,一共就兩行代碼,校對了100遍也看不出什麼錯誤,排除!)
2.這是我第一次使用jp,是否是這個編譯器出現問題了?(應該不會吧,其它加減乘除均可以的呀,路徑/環境從錯誤中能夠看出也沒有問題,爲確保萬無一失,
我在cmd中查看個人pandas庫是否安裝,種種跡象代表應該不是編譯器的問題,但我仍是不放心,因爲我屢次使用且運行pc(pycharm)是沒有問題的,我把這
兩行代碼放到pc上是否是能夠正常運行,可是實踐告訴我也出錯了,也排除了jp的錯誤,冤枉它了,對不起!)
3.有多是我讀取的數據集有問題,由於錯誤的最後是:'utf-8' codec can't decode byte 0xcf in position 2: invalid continuation byte ,這讓我想起數據集通常都不
是utf-8的格式,所以我另存爲了utf-8格式的.csv數據集,而後進行數據的讀取操做,終於正常了!
3、反思
這一個可能對於有經驗的程序員來講可能幾分鐘或者幾秒鐘就解決了,而我花了將近一個小時進行思考、錯誤定位、實踐檢驗等,這其中有個人不仔細形成的錯誤,
也有原先我並不知道的錯誤,現將這些錯誤整理一下,爲未來的本身或者讀者遇到相似的問題能夠參考,也是對本身的一種反思、警惕!
2019.05.19