一年一度的秋招已經打響了發令槍,從去年的薪酬排行來看,算法工程師和數據分析等工做排在前列,不少相關專業的學生一直在自學一些網絡上的公開課並閱讀一些專業書籍,好比「西瓜書」、「花書」等,若是你如今仍然什麼也沒有準備的話,然而還想從事數據科學領域這個彷佛使人望而生畏的工做話,如今就要抓緊補補相關的知識了。在這裏要提示一點,自我完善的知識不要侷限於數據分析相關的知識,還要額外補充下相關領域的知識。另外,簡歷上展現我的技能的最佳方式是使用技能組合的形式,這樣能讓僱主相信你可使用你已經學習的技能。爲了展現這些技能,如下是你應該着重補充的5種數據科學項目組合類型:算法
數據科學家預計在一個新項目的清理數據處理上花費多達80%的時間,這對於團隊來講是一個巨大的代價。若是你能夠證實你在數據清理方面經驗豐富,那麼你將當即變得更有價值。練習這項能力的方法是建立一個數據清理項目,找到一些混亂的數據集並開始進行清理。編程
若是你使用Python語言進行編程,那麼Pandas是一個很好用的庫,若是你使用R語言編程,那麼你可使用dplyr數據包。你實踐的數據清洗項目應該確保展現如下技能:網絡
數據科學的另外一個重要方面是探索性數據分析(EDA),這是一個生成問題並用可視化方法對其進行調查的過程。 EDA容許分析人員從數據中得出結論來推進業務影響,它可能包括基於客戶細分的有趣洞察,或基於季節效應的銷售趨勢。一般你能夠經過探索性數據分析來獲得一些有趣的發現。學習
用於探索性分析的一些有用的Python庫有Pandas和Matplotlib。對於R用戶而言,ggplot2軟件包將會頗有用。你實踐的EDA項目應該顯示如下技能:spa