自然語言處理期末複習(1)n元模型

一、n元模型 1.語言建模:根據給定的語言樣本估計概率P(s)的過程 2.語言模型:根據語言樣本估計出的概率分佈P稱爲語言L的語言模型。 3.馬爾科夫假設:詞wi 的出現只與其前n-1個詞有關 4.n元組(n-gram):只需要考慮n個詞組成的片段。(n越大,模型需要的參數越多,歷史信息越多,模型越準確) 5.如何建立n元模型:確定訓練語料、對預料進行分詞、句子邊界標記,增加兩個特殊詞。建立n元模
相關文章
相關標籤/搜索