小項目-數據處理篇:pandas進行工做相關數據清洗

先看看咱們今天要處理的數據,爬取的成果: 工做信息7000多條 租房信息差很少6w條 本章任務: 一、去重工做地址,獲取地址座標(高德) 二、去重公司,獲取公司狀況 三、工做篩選,因爲智聯上爬取的工做,好多事工做內容裏有python,只用python謝謝腳本啥的,實際標題上找的是java啊,php啊,這樣的工做要刪掉 四、剔除數據異常值,過大太小,NA值 五、工做根據,工做,公司狀況,工做內容,技
相關文章
相關標籤/搜索