1.1 引言數據結構
多元統計分析(簡稱多元分析)是運用數理統計的方法來研究多變量(多指標)問題的理論和方法,它是一元統計學的推廣.在實際間題中,不少隨機現象涉及到的變量不是一個,而常常是多個變量,而且這些變量間又存在必定的聯繫.ci
英國著名統計學家肯德爾(Kendall)在《多元分析》一書中把多元統計分析所研究的內容和方法歸納爲如下幾個方面.io
1.簡化數據結構(降維問題)class
簡化數據結構便是將某些較複雜的數據結構經過變量變換等方法使相互依賴的變量變成互不相關的;或把高維空間的數據投影到低維空間,使問題獲得簡化而損失的信息又不太多的.例如主成分分析、因子分析,以及對應分析等多元統計方法就是這樣的一類方法.基礎
2.分類與判別(歸類問題)變量
歸類問題便是對所考察的觀測點(或變量)按類似程度進行分類(或歸類).例如聚類分析和判別分析等方法就是解決這類問題的統計方法.方法
3.變量間的相互聯繫im
(1)相互依賴關係:分析一個或幾個變量的變化是否依賴於另外一些變量的變化?若是是,創建變量間的定量關係式,並用於預測或控制一一回歸分析.統計
(2)變量間的相互關係:分析兩組變量間的相互關係-一典型相關分析.數據
4.多元數據的統計推斷
這是關於參數估計和假設檢驗的間題.特別是多元正態分佈的均值向量及協方差陣的估計和假設檢驗等問題.
5.多元統計分析的理論基礎
多元統計分析的理論基礎包括多維隨機向量及多維正態隨機向量,以及由此定義的各類多元統計量,推導它們的分佈並研究其性質,研究它們的抽樣分佈理論。這些不只是統計估計和假設檢驗的基礎,也是多元統計分析的理論基礎.
1 .2多元統計分析的應用
略
1.3多元統計數據的圖表示法
1、輪廓圖
輪廓圖的做圖步驟爲:
(1)做直角座標系,橫座標取p個點,以表示p個變量;
(2)對給定的一次觀測值,在p個點上的縱座標(即高度)與對應的變量取值成正比;
(3)連結此p個點得一折線,即爲該次觀測值的一條輪廓線;
(4)對於n次觀測值,每次都重複上述步驟,可畫出n條折線,構成n次觀測值的輪廓圖.
2、雷達圖
雷達圖的做圖步驟是:
(1)做一圓,並把圓周分爲p等分;
(2)連結圓心和各分點,把這p條半徑依次定義爲各變量的坐
標軸,並標以適當的刻度;
(3)對給定的一次觀測值,把p個變量值分別取在相應的座標
軸上,而後將它們連結成一個p邊形;
(4) n次觀測值可畫出n個p邊形.
3、調和曲線圖
4、散佈圖矩陣