文本語言模型的參數估計-最大似然估計、MAP及貝葉斯估計

以PLSA和LDA爲表明的文本語言模型是當今統計天然語言處理研究的熱點問題。這類語言模型通常都是對文本的生成過程提出本身的機率圖模型,而後利用觀察到的語料數據對模型參數作估計。有了語言模型和相應的模型參數,咱們能夠有不少重要的應用,好比文本特徵降維、文本主題分析等等。本文主要介紹文本分析的三類參數估計方法-最大似然估計MLE、最大後驗機率估計MAP及貝葉斯估計。php 一、最大似然估計MLEide
相關文章
相關標籤/搜索