深度學習（二）————文本預處理、語言模型、循環神經網絡基礎

時間 2020-12-30

標籤深度學習简体版

原文原文鏈接

目錄文本預處理語言模型 n-gram語言模型神經網絡語言模型循環神經網絡基礎簡介計算過程文本預處理文本是一類序列數據，一篇文章可以看作是字符或單詞的序列，本節將介紹文本數據的常見預處理步驟，預處理通常包括四個步驟：讀入文本分詞建立字典，將每個詞映射到一個唯一的索引（index）將文本從詞的序列轉換爲索引的序列，方便輸入模型常用文本預處理python庫有Standford

>>阅读原文<<