深度學習Task2

時間 2020-12-30

原文原文鏈接

文本預處理讀入文本分詞建立字典，將每個詞映射到一個唯一的索引（index）將文本從詞的序列轉換爲索引的序列，方便輸入模型課後練習語言模型與數據集語言模型假設序列w1、w2……wt中的每個詞是依次生成的，我們有語言模型的參數就是詞的概率以及給定前幾個詞情況下的條件概率。設訓練數據集爲一個大型文本語料庫，如維基百科的所有條目，詞的概率可以通過該詞在訓練數據集中的相對詞頻來計算，例如，

>>阅读原文<<