spss之迴歸

spss modeler-迴歸函數

正態分佈(高斯分佈):url

       若隨機變量X服從一個數學指望爲μ、方差爲σ^2的正態分佈,記爲N(μ,σ^2)。其機率密度函數爲正態分佈的指望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈spa

逆高斯分佈:事件

二項分佈:ip

二項分佈就是重複n次獨立的伯努利試驗。(拋硬幣)在每次試驗中只有兩種可能的結果,並且兩種結果發生與否互相對立,而且相互獨立,與其它各次試驗結果無關,事件發生與否的機率在每一次獨立試驗中都保持不變,則這一系列試驗總稱爲n重伯努利實驗,當試驗次數爲1時,二項分佈服從0-1分佈。ci

負二項分佈:rem

伽馬分佈:get

統計學的一種連續機率函數數學

泊松分佈:it

tweedle分佈:

多項式分佈:

 

 

 

迴歸:連續型擬合

1,descriptive statistics:描述性統計

  mean:均值

  Std.Deviation:標準差

  N:所使用的記錄數

 

2,correlations:相關性

  主要分爲:pearson correlations(皮爾森相關) :對稱矩陣,表示變量之間兩兩相關係數。越接近1相關程度越高。

       sig.(1-tailed)(單托維顯著性):只要是顯著性,無論是單托維或者雙托維,都和0.05做比較。越接近0.05顯著性越高。

       N:表示不一樣的變量之間的數據值。

 

3,variables entered/removed:變量的進入/移出,表示生成模型的第一步

 

4,model summary:模型概述

  R:所獲得的曲線擬合程度,和1作比較

  R square:R的平方,曲線擬合的優異程度,和1作比較。

  adjusted R square:模型複雜度的懲罰值。和1作比較。

  Std.Error of the Estimate:預估的標準誤。標準誤=標準差/樣本容量的開方。均值的置信區間是根據標準誤來算的。

  

  selection criteria:選擇的標準

    AIC:模型簡潔度,此值越小越好。

    MPC:模型變量選擇權衡點,此值越小越好。

  D-W:在必定程度上表達殘差是否服從正太分佈,越服從正太分佈說明變量之間獨立性越強,相關性越弱,正如咱們所須要的,通常此值在0-4之間,越接近2越好。

 

5,ANOVA:方差分析

  分爲兩大部分:regression 迴歸        residual 殘差

    sum of square:方差之和 

    df:自由度,取值不受限制的那些變量的個數,等於n-1

    mean square:均方差

    F:f值,一般用自由度能夠查到自由度所對應F值,而後再跟模型計算的F值作比較,若計算的F值小於所查到的F值,說明差別不明顯(F檢驗:方差齊性檢驗),若大於,則要進行T檢驗。

    sig.:顯著性,和0.05比較。若是是0.9的置信區間,則和0.1做比較。

 

6,coefficients:迴歸係數

  unstandardized coefficients:非標化的迴歸係數

    B:如下每一個量的迴歸係數

    Std.Error:如下每一個量的標準誤

  standardized coefficients:標化的迴歸係數(一般直接看此項就行)

    beta:如下每項的標註化迴歸係數

  collinearity statistics:共線性統計,判斷獨立性

    tolerance:容忍度,容差

    VIF:與容忍度成反比,通常此值小於10說明變量之間獨立性相對較好。

 

7,coefficients correlations:迴歸係數的相關性

  correlations:各個變量之間的相關性,通常在0.8或者0.7如下最好。如果高於0.9,那麼要對變量從新選擇或者其餘處理。

  covariances:協方差

 

8,collinearity diagnostics:多重共線性診斷

  condition index:條件指數,通常小於10認爲不存在多重共線性,說明變量之間獨立性較好。

 

9,residuals statistics:殘差統計

  最小值,最大值,均值,殘差的標準差,殘差個數

 

當共線性不能接受時:1,要從新選擇變量;2,嘗試有偏向性估計;3,擴大樣本;4,設置「類型」節點時,有選擇的「輸入」角色。

推薦思路:1,將變量逐一與因變量進行相關分析。2,經過相關係數的篩選,將篩選的自變量與因變量一塊兒作多重回歸分析。

             

 邏輯迴歸:離散型擬合

在類型節點裏,若是變量是標誌、類型、名義等屬於二分或者多分的分類,那麼建議用logistic迴歸來作。

一,模型

  1,使用分割數據,爲每一個分割數據構建模型:

  多項式迴歸:分爲多個類來計算。

        多項式過程—模型類型:

          主效應:不考量相互之間結合對主成因的關係,只考量各自對主成因的效應關係。

          全析因:所有考量

          自定義:自定義各個變量之間的關係考量。(還可選所選變量之間的各自組合形式)

  二項式迴歸:分爲2,4類來計算。

 

GenLin模型:可模擬離散或者連續型變量。

一,專家

1,目標字段分佈和鏈接函數:

   分佈:

相關文章
相關標籤/搜索