寫一些看早期論文經常出現的數學工具html
教程不少,珠玉在前,很少寫,只作個備忘。工具
伯努利型貝葉斯或者多項式型貝葉斯,SEEM5680text mining 學了。比較熟悉,不寫了。主要就是考慮詞的出現與否/出現次數,與該分類的相關程度;學習
最先是在seq2seq瞭解到這個模型,今天再回顧一下。翻譯
ref:htm
https://www.cnblogs.com/skyme/p/4651331.htmlblog
http://www.cnblogs.com/en-heng/p/6164145.html教程
首先講一下最大熵模型(MaxEnt),保留全部(不自相矛盾的)可能信息來預測機率,計算量巨大,可用於機器翻譯,句法標註等。數學
而後講HMM,經典的骰子模型能夠體現隱含狀態鏈與可見狀態鏈,轉換機率,輸出機率等概念,可用於已知一部分參數,求另外一些。通常有三個問題:it
1.機率計算io
2.學習可見狀態,使生成可見狀態的機率最大
3.解碼,已知可見狀態與模型,求隱含狀態鏈
MEMM直接學習條件機率:給定前一狀態和當前觀測的狀況下,輸出當前狀態的機率。
問題:標註偏置,有更多狀態轉移可能的狀態比重會偏小
Conditional HMM,作了全局歸一化,從了避免了local bias
Ref:https://www.cnblogs.com/en-heng/p/6214023.html