年薪50萬的大數據分析師養成記【摘抄】

如下是一位在數據分析領域打滾了N年後,寫下的一些體會,必定能給新人一些借鑑的地方。(總結的不錯,你們能夠借鑑學習哦)php

1、數據分析師有哪些要求?html

  一、理論要求及對數字的敏感性,包括統計知識、市場研究、模型原理等。算法

  二、工具使用,包括挖掘工具、數據庫、經常使用辦公軟件(excel、PPT、word、腦圖)等。數據庫

  三、業務理解能力和對商業的敏感性。對商業及產品要有深入的理解,由於數據分析的出發點就是要解決商業的問題,只有理解了商業問題,才能轉換成數據分析的問題,從而知足部門的要求。編程

  四、彙報和圖表展示能力。這是臨門一腳,作得再好的分析模型,若是不能很好地展現給領導和客戶,成效就大打折扣,也會影響到數據分析師的職業晉升。安全

2、請把數據分析做爲一種能力來培養微信

  從廣義來講,如今大多數的工做都須要用到分析能力,特別是數據化運營理念深刻的今天,像BAT這樣的公司強調全員參與數據化運營,因此,把它做爲一種能力培訓,將會讓你終生受益。網絡

3、從數據分析的四個步驟來看清數據分析師需具有的能力和知識:分佈式

  數據分析的四個步驟(這有別於數據挖掘流程:商業理解、數據理解、數據準備、模型搭建、模型評估、模型部署),是從更宏觀地展現數據分析的過程:獲取數據、處理數據、分析數據、呈現數據。工具

  (一) 獲取數據

  獲取數據的前提是對商業問題的理解,把商業問題轉化成數據問題,要經過現象發現本質,肯定從哪些緯度來分析問題,界定問題後,進行數據的採集。此環節,須要數據分析師具有結構化的思惟和對商業問題的理解能力。

  推薦書籍:《金字塔原理》、麥肯錫三部曲:《麥肯錫意識》、《麥肯錫工具》、《麥肯錫方法》

  工具:思惟導圖、mindmanager軟件

  (二) 處理數據

  一個數據分析項目,一般數據處理時間佔70%以上,使用先進的工具備利於提高效率,因此儘可能學習最新最有效的處理工具,如下介紹的是最傳統的,但卻頗有效率的工具:

  Excel:平常在作通報、報告和抽樣分析中常常用到,其圖表功能很強大,處理10萬級別的數據很輕鬆。

  UltraEdit:文本工具,比TXT工具好用,打開和運行速度都比較快。

  ACCESS:桌面數據庫,主要是用於平常的抽樣分析(作全量統計分析,消耗資源和時間較多,一般分析師會隨機抽取部分數據進行分析),使用SQL語言,處理100萬級別的數據仍是很快捷。

  Orcle、SQL sever:處理千萬級別的數據須要用到這兩類數據庫。

  固然,在本身能力和時間容許的狀況下,學習新流行的分佈式數據庫及提高自身的編程能力,對將來的職業發展也有很大幫助。

  分析軟件主要推薦:

  SPSS系列:老牌的統計分析軟件,SPSS Statistics(偏統計功能、市場研究)、SPSS Modeler(偏數據挖掘),不用編程,易學。

  SAS:老牌經典挖掘軟件,須要編程。

  R:開源軟件,新流行,對非結構化數據處理效率上更高,需編程。

  隨着文本挖掘技術進一步發展,對非結構化數據的分析需求也愈來愈大,須要進一步關注文本挖掘工具的使用。

  (三) 分析數據

  分析數據,須要用到各種的模型,包括關聯規則、聚類、分類、預測模型等,其中一個最重要的思想是對比,任何的數據須要在參照系下進行對比,結論纔有意義。

  推薦的書籍:

  一、《數據挖掘與數據化運營實戰,思路、方法、技巧與應用》,盧輝着,機械出版社。這本書是近年國內寫得最好的,務必把它看成聖經同樣來讀。

  二、《誰說菜鳥不會數據分析(入門篇)》和《誰說菜鳥不會數據分析(工具篇)》,張文霖等編着。屬於入門級的書,適合初學者。

  三、《統計學》第五版,賈俊平等編着,中國人民大學出版社。比較好的一本統計學的書。

  四、《數據挖掘導論》完整版,[美]Pang-Ning Tan等着,範明等翻譯,人民郵電出版社。

  五、《數據挖掘概念與技術》,Jiawei Han等着,範明等翻譯,機械工業出版社。這本書相對難一些。

  六、《市場研究定量分析方法與應用》,簡明等編着,中國人民大學出版社。

  七、《問卷統計分析實務—SPSS操做與應用》,吳明隆着,重慶大學出版社。在市場調查領域比較出名的一本書,對問卷調查數據分析講解比較詳細。

  

  (四) 呈現數據

  該部分須要把數據結果進行有效的呈現和演講彙報,須要用到金字塔原理、圖表及PPT、word的呈現,培養良好的演講能力。

  推薦書籍:

  一、《說服力讓你的PPT會說話》,張志等編着,人民郵電出版社。

  二、《別告訴我你懂ppt》增強版,李治着,北京大學出版社。

  三、《用圖表說話》,基恩。澤拉茲尼着,馬曉路等翻譯,清華大學出版社。

  (五) 其餘的知識結構

  數據分析師除了具有數學知識外,還要具有市場研究、營銷管理、心理學、行爲學、產品運營、互聯網、大數據等方面的知識,須要構建完整普遍的知識體系,才能支撐解決平常遇到的不一樣類型的商業問題。

  推薦書籍:

  一、《消費者行爲學》第10版,希夫曼等人着,江林等翻譯,中國人民大學出版社,如今應該更新到更高的版本。

  二、《怪誕行爲學》升級版,艾瑞里着,趙德亮等翻譯,中信出版社

  三、《營銷管理》,科特勒等着,梅清豪翻譯,格致出版社和上海人民出版社聯合出版

  四、《互聯網思惟—獨孤九劍》,趙大偉主編,機械出版社

  五、《大數據時代—生活、工做與思惟的大變革》,舍恩伯格等着,周濤等翻譯,浙江人民出版社

4、關於數據分析師的職業發展:

  一、數據分析師一般分兩類,分工不一樣,但各有優點。

  一類是在專門的挖掘團隊裏面從事數據挖掘和分析工做的。若是你能在這類專業團隊學習成長,那是幸運的,但進入這類團隊的門檻較高,須要紮實的數據挖掘知識、挖掘工具應用經驗和編程能力。該類分析師更偏向技術線條,將來的職業通道可能走專家的技術路線。

  另外一類是下沉到各業務團隊或者運營部門的數據分析師,成爲業務團隊的一員。他們工做是支撐業務運營,包括平常業務的異常監控、客戶和市場研究、參與產品開發、創建數據模型提高運營效率等。該類型分析師偏向產品和運營,能夠轉向作運營和產品。

  二、數據分析師的理想行業在互聯網,但條條大道通羅馬,走合適你的路線。

  從行業的角度來看:

  1)互聯網行業是數據分析應用最廣的行業,其中的電商企業,更是目前最火的,並且企業也更重視數據分析的價值,是數據分析師理想的成長平臺。

  2)其次是諮詢公司(好比專門的數據挖掘公司Teradata、尼爾森等市場研究公司),他們須要數據分析人才,並且相對來講,數據分析師在諮詢公司成長的速度更快,專業也會更全面。

  3)再次是金融行業,好比銀行和證券等行業,該行業對數據分析的依賴需求,愈來愈大。

  4)最後是電信行業(中國移動、聯通和電信),它們擁有海量的數據,在嚴峻的競爭下,也愈來愈重視數據分析,但進入這些公司的門檻比較高。

5、什麼人適合學習數據分析?

  這個問題的答案跟「什麼人適合學功夫」同樣,毫無疑問,功夫是適合任何人學習的(排除心術不正的人),由於可以強身健體。而功夫的成效,要看習武者的修煉深淺。經常有人爭論,是詠春拳厲害,仍是散打厲害,實際上是顛倒了因果,應該看哪一個人練習得比較好,流派之間沒有高低,只有人修煉的厚薄。

  實際上,問題的潛臺詞是「什麼人學習數據分析,會更容易取得成功(好比職業成功)」,這個要視乎你的興趣、付出和機遇。但要作到出類拔萃,除了上面三點,還須要一點天賦,這裏的機遇是指你遇到的職業發展平臺、商業環境、導師和同事。

  借用管理大師德魯克的話「管理是能夠習得的」,管理並不是是天生的,而數據分析能力,也能夠後天提高。或許作到優秀,只須要你更加的努力+興趣,而這個努力的過程,也包括你尋找機遇的部分。

6、關於如何學習:

  學習方法千萬種,關鍵是找到適合本身的,最好可以結合你的工做遇到的問題來學習。

  一、蒐集書籍、案例庫和視頻,先弄懂理論,而後學會軟件操做,本身製做屬於本身的教程。

  好比,你學習聚類分析模型。1)蒐集相關的聚類分析模型的書籍、案例和教學視頻,瞭解聚類分析的原理,主要有哪幾種算法(劃分、層次、密度、網格)、模型適用的範圍和前提、如何評估模型的精確度等。

  2)本身學會用軟件來實現。

  3)總結整理成一份PPT和製做操做視頻,成爲本身的學習教程,不斷完善。

  4)學習到必定程度後,能夠在博客、微信等渠道分享,授人與漁,而本身也會有所收穫。

  二、關注名人、名博、網站,多渠道學習。

  1)關注專業的數據分析、諮詢公司網站和論壇,特別強調,統計軟件公司的網站如SPSS的官網有不少案例庫,值得關注。

  SPSS的案例庫,可在官網上搜索各種案例:http://www.ibm.com/developerwork ... 8zhangzy/index.html

  另外,你最好建一個本身的網址導航目錄,提高你的學習效率

  2)關注名人名博,最好能加他們的微博、微信和微信公衆號,看牛人的博客和微信等內容,仍是能獲得不少引導,這個你懂的。

  3)加入一些有共同愛好的QQ羣,互相學習交流。一般羣裏有人會提出一些真實的運營問題,而後你們用不一樣的方法去解決,對思路頗有啓發。

  4)碎片化學習,最大化你的時間價值。爲了把零散的時間利用起來,一般我會把一些資料上載到網盤,在零碎的時間裏經過手機進行視頻、文檔學習等。目前使用百度雲盤和360網盤。百度雲盤應用比較廣,一般在網絡上搜索「關鍵詞+百度雲」後,搜到結果能夠直接保存在雲盤上,搜索保存速度極大提高。360網盤則空間比較大,能夠到達40T,同時有保險箱加密功能,安全性高一些。

  手機上安裝一些APP,隨時隨地學習。

7、最後的建議

  請再次問問本身,是否真的喜歡數據分析,可否忍受處理數據時的寂寞?若是是,那就開始學習,給你幾條建議。

 

  一、把數據分析做爲一種能力培養,讓本身在如今的團隊中展示出良好的數據分析能力,爲你之後內部轉崗作好準備。若是內部轉崗不成,你能夠考慮跳槽到我以前分析的行業中,但我強烈建議你仍是須要把系統開發的編程能力學習好,而且對商業智能系統(BI和CRM)有必定了解,這也許是應聘數據分析的優點。若是沒有數據分析經驗去應聘,相對會難一些,用人單位會考你統計和數據挖掘模型方面的知識,以及工具使用狀況。

 

  二、在公司裏找一些有共同愛好的同事一塊兒學習數據分析,平時多請教數據分析作得好的同事,它山之石,能夠攻玉。

 

  三、紮實學好1、兩門數據挖掘軟件,基於你有編程的基礎,建議你能夠學SAS或者R,同時輔助學習SPSS Modeler。若是沒編程基礎或者但願短時間可以取得成效,那也能夠先學習SPSS。SAS+SPSS,基本可以知足很大部分企業的需求,三者都會,那更好。

 

  四、要了解公司是如何運營,產品是如何開發的,如何作客戶研究鎖定客戶需求,如何作產品營銷,這些須要不斷工做積累和普遍的閱讀。

 

  五、開始學習時,先讀幾本有趣的數據分析類的書,而後系統學習一下統計知識(建議教材用《統計學》第五版,賈俊平等編着),接着網上快速蒐集軟件操做視頻和案例,而後逐個分析模型進行學習和總結概括,學習最好可以結合實際工做中的問題進行。

 

  六、學習到必定程度時,參加一些數據分析師的職業認證,進一步梳理知識結構,同時認識一些志同道合的朋友和老師,也是對你有很大幫助。

 

  但願你可以成爲你想成爲的人!

 

原文:http://bbs.pinggu.org/thread-5045933-1-1.html

相關文章
相關標籤/搜索