成爲數據科學家的7本入門推薦書籍

本文成爲數據科學家的7本入門推薦書籍翻譯自[Tomi Mester]()的Wannabe Data Scientists! Learn the basics with these 7 books!
本文從屬於筆者的程序猿的數據科學與機器學習實戰手冊系列,若是你想了解更多關於數據科學、機器學習、深度學習的資料能夠參考面向程序猿的數據科學與機器學習知識體系及資料合集git


在過去的幾年中我一直在閱讀各式各樣的數據科學方面的書籍資料,上述7本是我我的最爲欣賞的,它們都是我認爲的將數據科學的基礎原理闡述的通俗易懂的頗有價值的資料。書讀百遍,其義自見,即便你初看之下以爲晦澀難懂,相信多讀幾遍也就慢慢理解了。另外若是你以爲單純閱讀有點無聊的話,也能夠帶着看看我以前推薦的10個免費在線課程,相輔相成,相信你會學習的更快。github

1. Lean Analytics — by Croll & Yoskovitz

第一本書是教會你如何創建基本的以商業思惟去使用這些數據,雖然這本書自己定位是面向初學者,不過我以爲你能夠從中學到更多。你能夠從本書中學到一條基本準則、6個基礎的線上商業形態以及隱藏其後的數據策略。編程

2. Business value in the ocean of data — by Fajszi, Cser & Fehér

若是說Lean Analytics是關於面向初學者講解商業邏輯加上數據,那麼本書是面向大型公司來說解這些內容。聽上去好像沒啥新鮮的,不過每每初創企業與獨角獸之間面對的問題是千差萬別,本書中會介紹譬如保險公司是如何進行訂價預測或者銀行從業者們又在面臨怎樣的數據問題。segmentfault

3. Naked Statistics — Charles Wheelan

這本書我一直非常推薦,由於它不單單面向數據科學家,而是爲任何一個行業的人提供基本的統計思惟,這一點偏偏是我認爲很是關鍵的。這本書並無太多的長篇大論,而是以一個又一個的故事形式來說解統計思惟在公司運營中的重要做用。架構

4. Doing Data Science — Schutt and O’Neil

這算是最後一本非技術向的書了吧,這本書相較於上面三本更上一層樓,他深刻了譬如擬合模型、垃圾信息過濾、推薦系統等等方面的知識。機器學習

5. Data Science at the Command Line — Janssens

在介紹本書以前首先要強調下,千萬不要畏懼編程,學習些簡單的編程知識可以有助於你作更多有趣的事。你能夠本身去獲取、清洗、轉化或者分析你的數據。不過我也不會一上來就扔出大堆的編程知識,我建議仍是從簡單的命令行操做開始學起,而本書正是介紹如何只用命令行就幫你完成些數據科學的任務。學習

6. Python for Data Analysis — McKinney

Python算是近幾年來很是流行的數據分析的語言了吧,人生苦短,請用Python。這本書算是個大部頭了,有400多頁吧,不過它首先爲你介紹了Python的基礎語法,所以學起來不會很困難吧。spa

7. I heart logs — Jay Kreps

最後一本書則是短小精悍,加起來才60多頁吧。不過它對於數據收集和處理的技術背景有很好的概述,雖然不少分析家或者數據科學家並不會直接用到這些知識,可是至少你可以理解技術人員們能夠用哪些架構去解決數據問題。命令行

相關文章
相關標籤/搜索