深度學習Task2

文本預處理 讀入文本 分詞 建立字典,將每個詞映射到一個唯一的索引(index) 將文本從詞的序列轉換爲索引的序列,方便輸入模型 課後練習 語言模型與數據集 語言模型 假設序列w1、w2……wt中的每個詞是依次生成的,我們有 語言模型的參數就是詞的概率以及給定前幾個詞情況下的條件概率。設訓練數據集爲一個大型文本語料庫,如維基百科的所有條目,詞的概率可以通過該詞在訓練數據集中的相對詞頻來計算,例如,
相關文章
相關標籤/搜索