NLP07_語言模型生成新的數據

Unigram model 使用詞庫,通過訓練語言模型得到每個單詞的一個概率。 通過Unigram model根據單詞的概率去生成句子,由於每個單詞的概率並沒有考慮上下文關係,所以生成的句子看起來並沒有什麼語法 Bigram Model BigramModel通過訓練數據得到的概率考慮單詞關係,所以生成的概率組成一個矩陣,最後加一個終止符號 通過大量的語料庫,我們可以訓練出一個語言模型,然後再根據
相關文章
相關標籤/搜索