引言:普通數據分析師與高級數據分析師的差別有一個很是重要的點,那就是數據思惟。數據思惟與數據敏感度有一些相似,都是相似於情商類的看不見摸不着的東西。簡單來講數據思惟是一種經過數據手段解決問題的思惟。
本文選自《從1開始——數據分析師成長之路》。面試
你們還記得中學時期或是大學時期的數學證實題嗎?
已知條件A、B、C、D條件,要求證實E是成立的。
一道證實題每每只是一句話,然而解題過程每每要佔據一整頁篇幅。幾何證實題出現的頻次更是尤爲高,還記得咱們在進行數學證實的時候作的證實流程嗎?幾乎全部的證實題都是要求經過已知條件轉換爲未知條件,而咱們證實的過程偏偏是方向解剖,若是要E成立須要什麼條件?假設須要E、F成立;E、F成立有須要G、H、I成立;G、H、I成立剛好須要A、B、C、D條件,證實完畢。
證實流程以下。
其實這就是一種以結果爲導向的思惟方法,數學帶給咱們的思惟最重要的體現就是在解決問題的方式上。證實題的流程之因此如此清晰嚴謹可能是由於出題者已經事先梳理了證實邏輯,對於解題者來講正確答案只有一個:證實D成立。
除了證實題,咱們還常常面對的另外一類問題是應用題。應用題大可能是把平常生活場景抽象簡化,在題目中描繪一個場景,常見的題型能夠歸類以下:
小明在的時候發現,A事件有a屬性,B事件的值是b,假設小明的C屬性數據是c,問小明在D時的值d是多少?
這類題目刻畫了一個事件場景,大多會交代時間、地點、人物、事件,而後給出一些參數,要求另一個參數的值。一樣,咱們想要知道D的值須要兩個條件E、F,想要知道E、F的值須要條件G、H、I,而G、H、I的值能夠經過A、B、C的值a、b、c求得。邏輯關係梳理完成後須要經過對a、b、c三個數值進行加減乘除簡單的數學計算或是積分求導等高階數學算法,最終求得結果d。應用題和證實題的區別在於它在證實題的邏輯思惟基礎之上增長了數值運算。
隨着應用場景的不斷複雜,咱們引入了一元一次方程、二元一次方程組、黎曼積分、極限思想等這些數學工具。這些工具發明的初衷在於解決實際生活中遇到的問題,只是實際生活中遇到的問題被抽象成了應用數學題。數學工具的不斷豐富和複雜,人們再也不拘泥於現實的應用場景,開始把數學研究單獨做爲一門技能進行拓展和延伸。因而產生了另外一類數學題。
已知公式A,條件是B,當n趨向於正無窮,求D。
A是B的全覆蓋,求證:C是D的全覆蓋。
P(A|B)=K,求P(C|A)。
……
此類問題已是進階到高等數學的範疇了,高等數學與普通數學的最大區別就在於其應用場景沒那麼明確具體,不像加減乘除可以讓你買菜,高等數學更加抽象和理論化。它們對應的是極限的思想,全面拆分問題的思想,這時咱們再看看本章開頭的兩個實例:
公元前5世紀,芝諾發表了著名的阿基里斯悖論:他提出讓烏龜在阿基里斯前面1000米處開始,和阿基里斯賽跑,而且假定阿基里斯的速度是烏龜的10倍。當比賽開始後,若阿基里斯跑了1000米,設所用的時間爲t,此時烏龜便領先他100米;當阿基里斯跑完下一個100米時,他所用的時間爲t/10,烏龜仍然前於他10米。當阿基里斯跑完下一個10米時,他所用的時間爲t/100,烏龜仍然前於他1米…… 芝諾認爲,阿基里斯可以繼續逼近烏龜,但毫不可能追上它。
一尺之棰,日取其半,萬世不竭。
這是極限思惟的實際案例,你們有沒有發現問題在哪裏呢?留做課後思考題吧!想清楚了天然豁然開朗,想不清楚能夠去找可以幫助你想清楚的方法,尋找答案的過程也算是數據分析思惟的一部分。
咱們看到上文給出的數學問題的三個模塊其實對應着數學思想的變化。
數學從提供解決問題的方法到變成數學工具,再變成數學思想。這一演變的過程爲咱們提供瞭解決問題的思路,思考問題的方法。數據分析的思惟能夠借鑑數學思想的內容,從解決實際問題的角度出發,找到須要解決這個問題的元素,一層一層地剝離下去,最終聯繫到咱們已有的資源。一樣,咱們拋開數據分析的實際應用場景去探索數據分析方法的優化空間和可行性,對已有的數據進行聚類、分類等探索性分析,提高數據的使用效率,挖掘數據中潛在的價值,這些就是數據分析的思惟方式。
數據分析的思惟是一種解決問題的方式,以結果爲導向的向數據源頭的追溯。數據分析師要有一種遇到問題解決問題的自信。沒有問題是沒法解決的,沒解決的緣由只能是投入大於產出,解決該問題帶來的收益小於投入。
技能是容易掌握的,可是思惟倒是很難培養的。從咱們接觸數學這門學科的那一天開始,數學就嘗試向咱們傳遞這樣一種思惟方式,所以,在面試數據分析師時我每每會問一問面試者的數學成績怎樣。數學成績可以部分反映一我的對數學思惟的理解與運用,即便他本身均可能沒有意識到這一點。這些關於數學解題的思惟方式正是數據分析師所須要的,也是數據分析師必備的。那麼,如何培養數據分析的思惟呢?不妨先培養解決數學問題的思惟。常常作一些邏輯推理題或是看一些偵探小說,會有幫助的。
數據分析思惟一方面體如今它的邏輯性和方向性,另外一個重要特徵是絕對客觀與絕對理性。「不以物喜,不以己悲」的態度對於數據分析思惟來講很重要,它可以幫助你摒棄主觀的偏見與見解。諸如遇到突發事件能在第一時間冷靜下來,拋去恐慌的情緒;對本身喜歡的項目客觀分析,不對數據進行修飾;對本身犯下的錯誤能客觀評論,給出解決方法等。喜怒哀樂是每一個人都會有的情緒,而對數據分析師而言,一旦進入工做就要絕對理性與客觀,這也是數據分析師思考問題的前提。
任何人都會犯錯誤,咱們在平常工做中不免會犯錯誤,做爲數據分析師,天天都和一大堆數據打交道,稍有不慎就會犯錯誤。如何對待本身犯下的錯誤是衡量一個數據分析師處理問題客觀性的重要標準。人們在面臨指責時的本能反應是逃避或是反擊,這是人性的弱點,數據分析師可否克服這樣的弱點將是他可否進階的重要因素。當領導指責你工做沒作好的時候你會以怎樣的態度去面對這個問題?
攻擊的態度:不是個人錯,是什麼什麼緣由形成的。
逃避的態度:好像是錯了,對不起!
客觀理性的態度:是我錯了,糾正方法是XXXX2小時內能夠完成。這次錯誤的緣由是XXXX,之後不會再犯了,本月績效相應的部分會進行扣除。
若是你是領導,你會喜歡哪一種態度呢?
領導永遠是以結果爲導向的,指責你犯錯或是沉浸在內疚的情緒中於事無補,第一時間應該作的事情是把結果作好,而後再進行自我反省,用最客觀的態度進行自我批評。這樣不只給本身一個教訓,也會讓領導不會所以過分責怪你。你已經給出了面對此錯誤的最好的解決方案,別人也不會再節外生枝。更大的多是領導會由於這件事增長對你的好感度與信任度。
我想你們都讀過歷史類或是戰爭類的小說,謀士給統帥的策略通常會給出上策、中策、下策,而統帥常常會出於人道主義原則選擇中策或是下策。越是厲害的謀士給出的策略出發點越是絕對理性,不考慮感性的情懷與仁慈,一切以成功爲最終目的。高階的數據分析師就要具備這種謀士的精神,客觀與理性的解決問題。一樣,只要統帥提出問題,謀士總能給出解決方案,雖然有些理想主義的情懷,可是能從必定意義上反映數據分析思惟的兩個方面:分析問題的思想;處理問題時的態度。
思惟與態度做爲數據分析思惟的兩個核心要素是衡量一個數據分析師水平的軟指標,培養本身的思惟與處理問題的態度須要在實踐中不斷完善和進步。「學而不思則罔,思而不學則殆」,數據分析的過程須要你們不斷思考、不斷實踐,才能在這樣一個過程當中不斷提高本身。
本文選自《從1開始——數據分析師成長之路》,點此連接可在博文視點官網查看此書。
算法