上週在極客時間偶然看到陳暘博士的關於數據分析的課程,以爲很不錯,便堅決果斷的花錢買了這個課程,今天抽空看了實戰分析第二講,感觸最深的就是學習過程必定要作筆記,不只能鍛鍊本身的概括總結能力,更能對這一講的東西進行回顧,還能時不時回頭看看當初的想法。因此,我也試着開始作些筆記,畢竟大神都是這麼過來的,好了,話很少說,進入今天的正題:數據分析全景圖及修煉指南。算法
該講主要引導讀者從全局去了解什麼是數據分析?爲何作數據分析?怎麼去作數據分析?答案就是:掌握數據,就是掌握規律。當你瞭解了市場數據,對它進行分析,就能夠獲得市場規律。當你掌握了產品自身的數據,對它進行分析,就能夠了解產品的用戶來源、用戶畫像等等。因此說數據是個全新的視角。數據分析如此重要,它不只是新時代的「數據結構 + 算法」,也更是企業爭奪人才的高地。數據結構
談到數據分析,咱們通常都會從3個方面入手:工具
數據分析的三駕馬車的關係以下:學習
下面來大體認識下這三駕馬車:blog
1)數據採集:數據分析
數據的採集,主要是和數據打交道,用工具對數據進行採集,經常使用的數據源,如何獲取它們。在專欄裏,後續會將介紹如何掌握「八爪魚」這個自動抓取的神器,它能夠幫你抓取 99% 的頁面源。也會教讀者如何編寫 Python 爬蟲。掌握 Python 爬蟲的樂趣是無窮的。它不只能讓你獲取微博上的熱點評論,自動下載例如「王祖賢」的海報,還能自動給微博加粉絲,讓你掌握自動化的快感。數學
2)數據挖掘:產品
數據挖掘,它能夠說是知識型的工程,至關於整個專欄中的「算法」部分。首先你要知道它的基本流程、十大算法、以及背後的數學基礎。自動化
掌握了數據挖掘,就比如手握水晶球同樣,它會經過歷史數據,告訴你將來會發生什麼。固然它也會告訴你這件事發生的置信度是怎樣的。數據挖掘
3)數據可視化
爲何說數據要可視化,由於數據每每是隱性的,尤爲是當數據量大的時候很難感知,可視化能夠幫咱們很好地理解這些數據的結構,以及分析結果的呈現。這是一個很是重要的步驟,也是咱們特別感興趣的一個步驟。
數據可視化的兩種方法:
Python :在 Python 對數據進行清洗、挖掘的過程當中,不少的庫可使用,像 Matplotlib、Seaborn 等第三方庫進行呈現。
第三方工具:若是你已經生成了 csv 格式文件,想要採用所見即所得的方式進行呈現,能夠採用微圖、DataV、Data GIF Maker 等第三方工具,它們能夠很方便地對數據進行處理,還能夠幫你製做呈現的效果。
數據分析包括數據採集、數據挖掘、數據可視化這三個部分。乍看你可能以爲東西不少,無從下手,或者感受數據挖掘涉及好多算法,有點「高深莫測」,掌握起來是否是會吃力。其實這些都是沒必要要的煩惱。我的以爲只要心裏篤定,認爲本身必定能作成,學成,其餘一切都是「紙老虎」哈。
再說下,陳博在文章中提到的如何來快速掌握數據分析,核心就是認知。咱們只有把知識轉化爲本身的語言,它才真正變成了咱們本身的東西。這個轉換的過程就是認知升級的過程。
我本人也是很贊同這種說法,簡單一句就是「知行合一」
總結