一提到數學,高等數學,線性代數,機率論與數理統計,數值分析,空間解析幾何這些數學課程,頭疼呀。做爲文科生,碰見這些課程時,一般都是各類尋求幫助,班上有位宅男數學很厲害,各類被女生‘圍觀’,這數學爲何這麼難,學了有啥用呀。git
有用的,當作數據分析的時候,使用到SPSS,在線SPSS分析的時候就知道用處了,在寫論文的時候會用到SPSS數據分析,工做的時候也會用到SPSS數據分析。此時才知道原來數學很重要。個人數學很差腫麼辦?聽我一 一道來。學習
1. 數據類型設計
學過數學的童鞋都知道,數學裏面分了兩類數據,離散和連續數據,聽上去文縐縐的,不懂。那我問男人和女人知道不,知道,對了這種就是離散數據。身高體重知道不,知道,這種就是連續數據。離散數據能夠理解爲分類,類別,數個數;而連續數據理解爲算平均值,度量,好比平均身高,平均年齡,但不能說成是平均性別。離散和連續數據是數學上文縐縐的稱呼。若是咱們是作數據分析,一般又換成另一種稱呼,定類和定量數據。定類就是離散數據,定量就是連續數據。這點get到後,數據分析方法啥都不在話下,讓智能化軟件SPSSAU【備註:在線網頁版SPSS】這些去解決就好,默認出來智能化文字分析結果。3d
2. X和Yblog
除了數據類型外,數學上總是有一些符號,好比X,Y,Z, α, β,γ,還有好多拉丁符號,看着都頭疼,並且更糟糕的是發音還那麼奇怪。這些都是數學用詞,若是是數據分析,只須要知道X和Y就能夠。爲何這麼簡單呢?數據分析一般是用於業務場景,讓全部人都會全部人都能懂的。而數學符號是專業性名詞,一小部分學習數學專業的人羣才懂。get
而X,Y基本全部人都懂,平面二維式思惟,若是加上Y就變成空間三維思惟。這種會變得複雜難懂,而數據分析出來結果是讓人理解讓人懂的,越簡單易懂越有意義越有用的結論越受歡迎。所以從數據分析角度來看,只須要懂X,Y這兩個符號就OK。別小看X,Y這兩個符號,加上上述的數據類型,它們能夠產生很是多的組合,也稱做分析方法。數據分析
有了X,Y,咱們能夠研究X和Y之間的關係狀況,好比X對於Y的影響關係,X對於Y的差別關係等。下面一一講述。數學
3. X和Y的組合方法it
再講組合以前,先單獨講下不區分X和Y的分析方法,以下表格:io
當不須要區分不區分X和Y時,好比我只研究性別1個數據,或者只研究身高,體重狀況如何等。並不須要研究關聯關係,因此並不涉及X和Y的關聯關係。這種均可統稱爲數據基本描述統計,固然數據類型不同時,方法不一樣。好比性別爲定類數據,這時用頻數分析;身高體重是定量數據,這時用描述分析。數據的基本描述統計是最基礎的數據分析方法,並且一般都須要作這類分析方法,由於瞭解了基本狀況是很是必要的。
接下來將下X和Y之間的關聯關係時,會使用到的數據研究方法;以下表格:
從上表能夠看到,一般會涉及到差別關係,相關關係和影響關係共三類。好比不一樣性別的興趣愛好是否有差別,性別爲定類數據,興趣愛好也是定類數據;此時就應該使用交叉卡方分析方法。好比研究性別人羣體重是否有差別,性別爲定類數據,體重爲定量數據,此時就須要使用T檢驗;除此以外,若是想研究不一樣專業(理科、工科、文科)的體重差別時,此時應該使用方差分析。當X是定類數據,Y是定量數據,研究X對於Y的差別時,可使用T檢驗和方差分析;區分在哪裏呢?若是X的類別個數(好比男和女)只有2個時,一般使用T檢驗;若是X的類別個數超過2個(好比理科、工科和文科)時,只能使用方差分析。差別關係就只能有3種,接下來繼續相關關係。
相關關係是研究X和Y的關係狀況,好比身高和體重之間有沒有關係;X和Y均是定量數據;此時應該使用相關關係,再具體一點應該叫Pearson相關關係(相關關係的數學公式是Pearson這人發明的)。
最後一類是影響關係;X對於Y的影響;影響關係的分析方法區分,徹底是根據Y的類別而定;好比Y是定量數據,咱們則應該使用線性迴歸分析;若是Y爲定類數據,此時咱們應該使用Logit迴歸分析,而具體再細分,Logit迴歸能夠有:二元Logit迴歸,多分類Logit迴歸,區分在於Y,舉例以下表:
若是X影響Y時,Y只分爲兩類,購買和不購買,願意和不肯意,是和否等,這時候就須要使用二元Logit迴歸分析;若是Y分爲n類(n>2)時,則須要使用多分類Logit迴歸。
數據類型,X和Y;這兩點搞明白後,絕大多數的數據研究方法均可以搞定,而這也是當前數學研究的核心思想。也是分析軟件的設計理念,網頁在線版本的SPSS即SPSSAU軟件平臺,它的設計核心理念就是這樣,只須要會區分數據類型,知道X和Y;就能夠本身進行數據分析,其它的所有均可以直接由SPSSAU生成智能化文字結果;固然,分析方法還有不少的,好比因子分析,聚類分析等,這些方法不是研究X和Y的關聯性,而是別有用處。
4. 其它研究方法
除開X與Y的關聯關係研究,其實還有一些其它的研究方法;好比對於不少個X同時進行分析應該使用什麼方法呢?此時可能會結合分析用處而對應不一樣的方法;常見有因子分析和聚類分析兩種,以下表:
若是說了30句話,如今想把30句話歸納濃縮成5個關鍵詞,這種就叫濃縮;此時須要使用因子分析;若是有300我的想進行分類,分紅3類人羣,此時可以使用聚類分析(常見是K-means聚類方法)。
除了濃縮和聚類,事實還有很是多其它的研究方法,好比信度研究,多因素方差,非參數檢驗,正態性檢驗,配對T檢驗等等。後續慢慢再談,更多知識也可以使用網頁版SPSS即SPSSAU【備註:在線網頁版SPSS】進行學習,裏面智能化分析結果一目瞭然,‘拖拽點一下’完成分析獲得智能化結果,更多研究方法的詳述也可直接查到。