做者 | 數據海洋
來源 | haiyangxinyong
一名數據分析師無論在什麼行業,在什麼類型的企業任職,把服務公司的業務流程、業務邏輯、業務與數據對應起來這是基礎的基礎。在這個前提下,經過我業務方的溝通與交流,你應該要了解的信息,在時間維度上,多是將來1個月,3個月,6個月或者12個月:數據庫
瞭解信息後,以KPI具體數值的爲例:數據分析師能夠多問本身幾個爲何,而後再和業務溝通你的理解,你纔有可能真正理解KPI背後的邏輯與緣由。業務包括:架構
不少數據分析師其實都不肯意或者認爲去了解和理解這些內容不重要,或者感受和本身作的事情無關。數據分析師從作的內容來講,能夠分紅如下幾個層次,每次層次的內容和分析師所處的階段和數據分析師資歷有關係。大數據
數據需求處理spa
所謂有數據需求,就是業務團隊根據業務須要。向你提出的但願分析師能從數據庫中提取的數據內容。例如:本月作了一個促銷活動,想知道促銷活動帶來了多少新客、顧客,同時想看一下,老客戶從過去某段時間內累計消費的頻次分佈。業務基於獲得的數據進行活動總結,來分析此次活動是否達到預期。設計
在一些業務快速發展的企業,數據需求處理每每佔據了數據分析師很是大的工做量。對於初級數據分析師來講,可能佔據了他們80%左右的工做時間。3d
不少數據分析師發現,特別是初級數據分析師在工做一段時間後。每天都是拉數據,處理爲完的數據需求;公司的大數據平臺或者數據倉庫建設不是那麼完善,數據提取效率比較低。對象
有時候由於數據底層的問題,致使提取數據的時候,可能用的表不同,致使數據取錯誤的數據。數據倉庫底層每每表很是多,1千多張是很正常的。不少公司的數據開發/治理不是那麼好,致使表的生命週期管理不是很好。常常對不經常使用的表可能會使用錯誤。blog
每每抱怨,數據分析師好像很是沒有「技術」含量。但在我我的認爲,這每每是最有「技術」含量的,數據需求每每是幫助一個數據分析師,去理解業務,理解業務痛點,和業務創建緊密關係的最重要的場景。生命週期
當我仍是一個初級數據分析師的時候:開發
在處理前:
在收到業務數據需求的時候,我每每都會去思考,給本身提幾個問題:
爲何要提這個需求?
業務中是誰真正會用這個數據?
要解決的問題是什麼?
用這些數據能不能真正解決業務的問題?
在處理後:
當我給出數據需求的時候,通常我會把每一個數據的口徑說明清楚,對本身給出的數據作出檢查。不少時候我會根據個人理解,再對這個需求提供多一些數據內容,幫助他可能要作進一步的數據分析。
對應數據需求的代碼,咱們作一下歸檔。每每不少時候,不少業務的數據需求都是會重複的或者相差不大,用寫的代代碼修改提取數據,速度要快不少。
在處理數據需求過程當中,會和業務溝通肯定一下數據口徑,也一塊兒問一下爲何會須要這個需求,若是態度比較好,通常業務同窗都很願意和你分享。經過與數據需求創建聯繫後,有空能夠和業務一塊兒吃吃飯,交流交流,會讓你更清楚業務狀況,這樣你也更好的知道應該如何提供數據服務,誰須要用相關數據來幹什麼。「數據需求是理解業務問題與痛點,與業務夥伴創建溝通的橋樑」
經驗分享:
在業務比較理解,數據比較熟悉後,我處理數據需求的時候,每每我會在理解完數據需求的基礎,主動和業務作一次溝通,通常是說咱們一塊兒肯定數據口徑。而後對數據需求中的數據口徑,時間範圍做一個討論,經過肯定數據需求。也順便了解一下業務。
不少同行會說,有時候很忙,沒有時候肯定。其實,若是你本身有理解清楚需求再加上溝通數據需求,對你後續數據需求處理效率,以及避免需求處理反工有很大幫助。
小觀點viewpoint若是你全部公司有很是多的各類臨時需求,一方面:通常說明公司業務還在發展或者變化中,很須要數據來支持和幫助。另外一方面:若是你不能很好的響應與處理需求,對你來講是個壞事,你會每天認爲本身的工做就是在處理需求,每天都在寫SQL代碼,沒有什麼價值。
數據分析師在處理數據需求的同時,必然都是各類數據報表的需求。各個開發或者設計過報表開發的數據分析師,有沒有思考過這些問題:
經驗分享:
一個好的數據分析師,每每都有一顆「好奇心」。每每對任何事情都會有不少爲何?對一個數據背後,數據分析師和普通人的思惟可能會不同。一樣看到某個報道上,某個城市人均月收入破8千,你的感受是什麼?好奇的數據分析師能夠會問如下問題:
基於這些進一步的數據後,才能對這些數據背後的東西作判斷。因此在設計報表的時候就要基於業務場景,來思考要用什麼樣的數據來幫助業務作出更正的判斷。
數據報表設計
在設計報表的時候經驗總結來看,能夠不斷問以幾個問題,從而能夠幫助更好的把數據報表設計好:
何時應該開發數據報表提供給業務團隊使用。當業務提出要開發數據報表的時候,數據分析師應該有基於業務知識的基礎上進行判斷。正常應該在二種狀況下比較適合開發數據報表:
經驗分享:收到報表需求後,數據分析師應該先有判斷。並不該該是收到數據需求後,當即就爲開發數據報表作準備,多分析這個數據報表需求,從業務穩定性、數據需求頻率等角度考慮。若是不開發成數據報表,能夠提供其它方式知足業務。
小結
一個數據分析師,若是能夠把數據報表設計好,數據需求處理好,對於業務來講,知足了業務基礎的數據服務,爲業務基於數據對業務異常的定位、監控。
當發現業務KPI數據指標很差,咱們定位好問題在哪發生?接下來應該要回答的,解決怎麼問題,怎麼辦?就須要咱們開始針對具體的業務問題,和業務場景進行專項的數據分析。下一篇咱們一塊兒來探討,如何開展一個數據分析。