克里金(Kriging)插值的原理與公式推導

轉自:http://xg1990.com/blog/archives/222ide

學過空間插值的人都知道克里金插值,可是它的變種繁多、公式複雜,還有個半方差函數讓人不知所云
本文講簡單介紹基本克里金插值的原理,及其推理過程。函數

0.引言——從反距離插值(IDW)提及

空間插值問題,就是在已知空間上若干離散點  (xi,yi)  的某一屬性(如氣溫,海拔)的觀測值  zi=z(xi,yi)  的條件下,估計空間上任意一點  (x,y)  的屬性值的問題。優化

直觀來說,根據地理學第必定律,atom

All attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones.spa

大意就是,地理屬性有空間相關性,相近的事物會更類似。由此人們發明了反距離插值,對於空間上任意一點  (x,y)  的屬性  z=z(x,y)  ,定義反距離插值公式估計量code

z^=i=0n1dαzi

其中  α  一般取1或者2。orm

即,用空間上全部已知點的數據加權求和來估計未知點的值,權重取決於距離的倒數(或者倒數的平方)。那麼,距離近的點,權重就大;距離遠的點,權重就小。blog

反距離插值能夠有效的基於地理學第必定律估計屬性值空間分佈,但仍然存在不少問題:ci

  • α  的值不肯定
  • 用倒數函數來描述空間關聯程度不夠準確

所以更加準確的克里金插值方法被提出來了數學

1.克里金插值的定義

相比反距離插值,克里金插值公式更加抽象

zo^=i=0nλizi

其中  zo^  是點  (xo,yo)  處的估計值,即  zo=z(xo,yo)  。

這裏的  λi  是權重係數。它一樣是用空間上全部已知點的數據加權求和來估計未知點的值。但權重係數並不是距離的倒數,而是可以知足點  (xo,yo)  處的估計值  zo^  與真實值  zo  的差最小的一套最優係數,即

minλiVar(zo^zo)

同時知足無偏估計的條件

E(zo^zo)=0

2.假設條件

不一樣的克里金插值方法的主要差別就是假設條件不一樣。本文僅介紹普通克里金插值的假設條件與應用。

普通克里金插值的假設條件爲,空間屬性  z  是均一的。對於空間任意一點  (x,y)  ,都有一樣的指望c與方差  σ2  。

即對任意點  (x,y)  都有

E[z(x,y)]=E[z]=c

Var[z(x,y)]=σ2

換一種說法:任意一點處的值  z(x,y)  ,都由區域平均值  c  和該點的隨機誤差  R(x,y)  組成,即

z(x,y)=E[z(x,y)]+R(x,y)]=c+R(x,y)

其中  R(x,y)  表示點  (x,y)  處的誤差,其方差均爲常數

Var[R(x,y)]=σ2

3.無偏約束條件

先分析無偏估計條件  E(zo^zo)=0  ,將  zo^=ni=0λizi  帶入則有

E(i=0nλizizo)=0

又由於對任意的z都有  E[z]=c  ,則

ci=0nλic=0

i=0nλi=1

這是  λi  的約束條件之一。

4.優化目標/代價函數J

再分析估計偏差  Var(zo^zo)  。爲方便公式推理,用符號  J  表示,即

J=Var(zo^zo)

則有

J=Var(ni=0λizizo)=Var(ni=0λizi)2Cov(ni=0λizi,zo)+Cov(zo,zo)=ni=0nj=0λiλjCov(zi,zj)2ni=0λiCov(zi,zo)+Cov(zo,zo)

爲簡化描述,定義符號  Cij=Cov(zi,zj)=Cov(Ri,Rj)  ,這裏  Ri=zic ,即點  (xi,yi)  處的屬性值相對於區域平均屬性值的誤差。

則有

J=i=0njnλiλjCij2i=0nλiCio+Coo

5.代價函數的最優解

再定義半方差函數  rij=σ2Cij  ,帶入J中,有

J=ni=0nj=0λiλj(σ2rij)2ni=0λi(σ2rio)+σ2roo=ni=0nj=0λiλj(σ2)ni=0nj=0λiλj(rij)2ni=0λi(σ2)+2ni=0λi(rio)+σ2roo

考慮到  ni=0λi=1

J=σ2ni=0njλiλj(rij)2σ2+2ni=0λi(rio)+σ2roo=2ni=0λi(rio)ni=0nj=0λiλj(rij)roo

咱們的目標是尋找使J最小的一組  λi  ,且J是  λi  的函數,所以直接將J對  λi  求偏導數令其爲0便可。即

Jλi=0;i=1,2,,n

可是要注意的是,咱們要保證求解出來的最優  λi  知足公式  ni=0λi=1  ,這是一個帶約束條件的最優化問題。使用拉格朗日乘數法求解,求解方法爲構造一個新的目標函數

J+ϕ(i=0nλi1)

其中  ϕ  是拉格朗日乘數。求解使這個代價函數最小的參數集  ϕ,λ1,λ2,,λn  ,則能知足其在  ni=0λi=1  約束下最小化  J  。即

(J+ϕ(ni=0λi1))λi(J+ϕ(ni=0λi1))ϕ=0;i=1,2,,n=0

(2ni=0λi(rio)ni=0njλiλj(rij)roo)λi(2ni=0λi(rio)ni=0njλiλj(rij)roo)ϕ=0;i=1,2,,n=0

{2rionj=1(rij+rji)λjni=0λi=0;i=1,2,,n=1

因爲  Cij=Cov(zi,zj)=Cji  ,所以一樣地  rij=rji  ,那麼有

{rionj=1rijλjni=0λi=0;i=1,2,,n=1

式子中半方差函數  rij  十分重要,最後會詳細解釋其計算與定義

在以上計算中咱們獲得了對於求解權重係數  λj  的方程組。寫成線性方程組的形式就是:

r11λ1+r12λ2++r1nλn+ϕr21λ1+r22λ2++r2nλn+ϕrn1λ1+rn2λ2++rnnλn+ϕλ1+λ2++λn=r1o=r2o=rno=1(1)

寫成矩陣形式即爲

r11r21rn11r12r22rn21r1nr2nrnn11110λ1λ2λn0=r1or2orno1

對矩陣求逆便可求解。

惟一未知的就是上文中定義的半方差函數  rij  ,接下來將詳細討論

6.半方差函數

上文中對半方差函數的定義爲

rij=σ2Cij

其等價形式爲

rij=12E[(zizj)2]

這也是半方差函數名稱的來由,接下來證實這兩者是等價的:

根據上文定義  Ri=zic  ,有  zizj=RiRj  ,則

rij=12E[(RiRj)2]=12E[R2i2RiRj+R2j]=12E[R2i]+12E[R2j]E[RiRj]

又由於:

E[R2i]=E[R2j]=E[(zic)2]=Var(zi)=σ2

E[RiRj]=E[(zic)(zjc)]=Cov(zi,zj)=Cij

因而有

rij=12E[(zizj)2]=12E[R2i]+12E[R2j]E[RiRj]=12σ2+12σ2Cij=σ2Cij

σ2Cij=12E[(zizj)2]  得證,如今的問題就是如何計算

rij=12E[(zizj)2]

這時須要用到地理學第必定律,空間上相近的屬性相近。  rij=12(zizj)2  表達了屬性的類似度;空間的類似度就用距離來表達,定義i與j之間的幾何距離

dij=d(zi,zj)=d((xi,yi),(xj,yj))=(xixj)2+(yiyj)2

克里金插值假設  rij  與  dij  存在着函數關係,這種函數關係能夠是線性、二次函數、指數、對數關係。爲了確認這種關係,咱們須要首先對觀測數據集

{z(x1,y1),z(x2,y2),z(x3,y3),,z(xn1,yn1),z(xn,yn)}

計算任意兩個點的 距離  dij=(xixj)2+(yiyj)2  和 半方差 σ2Cij=12E[(zizj)2]  ,這時會獲得  n2  個 

相關文章
相關標籤/搜索