條件隨機場的機率計算問題是給定條件隨機場 P(Y|X) ,輸入序列 x 和輸出序列 y ,計算條件機率 $P(Y_{i-1} = y_{i-1}Y_i = y_i|x)$ ,$P(Y_i = y_i|x)$ 以及相應的數學指望的問題。爲了方便起見,像 HMM 那樣,引進前向-後向向量,遞歸地計算以上機率及指望值。這樣的算法稱爲前向-後向算法。算法
對每一個指標 $i = 0,1,…,n+1$ ,定義前向向量 $a_i(x)$ ,對於起始狀態 $i=0$:ide
\[a_0(y|x) = \left \{ \begin{aligned}
&1, \ \ y = start \\
&0, \ \ else
\end{aligned}\right.\]
函數
對於以後的狀態 $i = 1,2,…,n+1$ ,遞推公式爲:spa
\[a_i^T(y_i|x) = a^T_{i-1}(y_{i-1}|x)M_i(y_{i-1},y_i|x)\]遞歸
這裏 $M_i(y_{i-1},y_i|x)$ 對應的是轉移矩陣中的一列,轉爲向量形式可表示爲數學
\[a^T_i(x) = a^T_{i-1}(x)M_i(x)\]經驗
$a_i(y_i|x)$ 表示在位置 i 的標記是 $y_i$ 而且到位置 i 的前部分標記序列的非規範化機率,$y_i$ 可取的值有 m 個,因此 $a_i(x)$ 是 m 維列向量。規範化
一樣,對每一個指標 $i = 0,1,…,n+1$ ,定義後向向量 $\beta_i(x)$:top
\[\beta_{n+1}(y_{n+1}|x) = \left \{ \begin{aligned}
&1, \ \ y_{n+1} = stop \\
&0, \ \ else
\end{aligned}\right.\]di
往前遞推:
\[\beta_i(y_i|x) = M_i(y_i,y_{i+1}|x)\beta_{i+1}(y_{i+1}|x)\]
又能夠表示爲:
\[\beta_i(x) = M_{i+1}(x) \beta_{i+1}(x)\]
$\beta_i(y_i|x)$ 表示在位置 i 的標記爲 $y_i$,而且從 i+1 到 n 的後部分標記序列的非規範化機率。
由前向-後向向量定義不可貴到:
\[Z(x) = a_n^T(x) \cdot \mathbf{1} = \mathbf{1}^T \cdot \beta_1(x)\]
這裏,$\mathbf{1}$ 是元素均爲 1 的 m 維列向量。
按照前向-後向向量的定義,很容易計算標記序列在位置 i 是標記 $y_i$ 的條件機率和在位置 i-1 與 i 是標記 $y_{i-1}$ 和 $y_i$ 的條件機率:
\begin{aligned}
P(Y_i= y_i|x) &= \frac{a_i^T(y_i|x) \beta_i(y_i|x)}{Z(x)} \\
P(Y_{i-1} = y_{i-1} ,Y_i= y_i|x) &=\frac{a_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)}
\end{aligned}
其中 $Z(x) = a_n^T(x) \cdot \mathbf{1} $
利用前向-後向向量,能夠計算特徵函數關於聯合分佈 P(X,Y) 和條件分佈 P(Y|X) 的數學指望。
特徵函數 $ \left \{ f_k \right \}_{k=1}^K$ 關於條件分佈 P(Y|X) 的數學指望是
\begin{aligned}
E_{p(Y|X)}[f_k] &= \sum_yP(y|x)f_k(y,x) \\
&=\sum_{i=1}^{n+1}\sum_{y_{i-1}\ y_i}f_k(y_{i-1},y_i,x,i) \frac{a_{i-1}^TM_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)}
\end{aligned}
其中 $Z(x) = a_n^T(x) \cdot \mathbf{1} $
假設經驗分佈爲 $\widetilde{P}(X)$ ,特徵函數 $ \left \{ f_k \right \}_{k=1}^K$ 關於聯合分佈 P(Y|X) 的數學指望是:
\begin{aligned}
E_{P(X,Y)}[f_k] &= \sum_{x,y}P(x,y)\sum_{i=1}^{n+1}f_k(y_{i-1}.y_i,x,i) \\
&= \sum_x\widetilde{P}(x) \sum_yP(y|x)\sum_{i=1}^{n+1}f_k(y_{i-1,}y_ix,i) \\
&= \sum_x\widetilde{P}(x) \sum_{i=1}^{n+1} \sum_{y_{i-1} \ y_i}f_k(y_{i-1,}y_ix,i)\frac{a_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x) \beta_i(y_i|x)}{Z(x)}
\end{aligned}
其中,$Z(x) = a_n^T(x) \cdot \mathbf{1} $
這個式子是特徵函數數學指望的通常計算公式。對於轉移特徵 $t_k(y_{i-1},y_i,x,i) ,k=1,2,…,K$ ,能夠將式中的 $f_k$ 換成 $t_k$ ;對於狀態特徵,能夠將式中的 $f_k$ 換成 $s_l$ , 表示爲 $s_l(y_i,x,i),k = K_1+1;l=1,2,…,K_2$ 。
有了這些式子,對於給定的觀測序列 x 與標記序列 y ,能夠經過一次前向掃描計算 $a_i$ 及 $Z(x)$ ,經過一次後向掃描計算 $\beta_i$,從而計算全部的機率和特徵的指望。