隱馬爾科夫模型定義算法
隱馬爾可夫模型是關於時序的機率模型,描述由一個隱藏的馬爾可夫鏈隨機生成不可觀測的狀態隨機序列,再由各個狀態生成一個觀測而產生觀測隨機序列的過程。markdown
隱藏的馬爾可夫鏈隨機生成的狀態的序列,稱爲狀態序列(state sequence);每一個狀態生成一個觀測,而由此產生的觀測的隨機序列,稱爲觀測序列(observation sequence)。ide
序列的每個位置又能夠看做是一個時刻。3d
下面咱們引入一些符號來表示這些定義:blog
設Q是全部可能的狀態的集合,V是全部可能的觀測的集合。
it
其中,N是可能的狀態數,M是可能的觀測數。io
狀態q是不可見的,觀測v是可見的。class
應用到詞性標註中,v表明詞語,是能夠觀察到的。q表明咱們要預測的詞性(一個詞可能對應多個詞性)是隱含狀態。lambda
應用到分詞中,v表明詞語,是能夠觀察的。q表明咱們的標籤(B,E這些標籤,表明一個詞語的開始,或者中間等等)方法
應用到命名實體識別中,v表明詞語,是能夠觀察的。q表明咱們的標籤(標籤表明着地點詞,時間詞這些)
上面提到的方法,有興趣的同窗能夠查閱相應資料。
I是長度爲T的狀態序列,O是對應的觀測序列。
咱們能夠看作是給定了一個詞(O)+詞性(I)的訓練集。或者一個詞(O)+分詞標籤(I)的訓練集....有了訓練數據,那麼再加上訓練算法則不少問題也就能夠解決了,問題後面慢慢道來~
咱們繼續定義A爲狀態轉移機率矩陣:
其中,
是在時刻t處於狀態qi的條件下在時刻t+1轉移到狀態qj的機率。
B是觀測機率矩陣:
其中,
是在時刻t處於狀態qj的條件下生成觀測vk的機率(也就是所謂的「發射機率」)。
因此咱們在其它資料中,常見到的生成機率與發射機率實際上是一個概念。
π是初始狀態機率向量:
其中,
隱馬爾可夫模型由初始狀態機率向量π、狀態轉移機率矩陣A和觀測機率矩陣B決定。π和A決定狀態序列,B決定觀測序列。所以,隱馬爾可夫模型能夠用三元符號表示,即
\lambda =(A,B,\Pi )稱爲隱馬爾可夫模型的三要素。
若是加上一個具體的狀態集合Q和觀測序列V,構成了HMM的五元組,這也是隱馬爾科夫模型的全部組成部分。
下面介紹一下隱馬爾可夫鏈的三個基本問題:一、已知模型求觀測序列出現的機率二、已知觀測序列,求模型的參數三、已知觀測序列求可能的狀態序列