nlp5-n-gram/語言模型(數據平滑方法

文章目錄 1.句子的先驗概率 1.1 n-gram 2. 參數估計 3. 數據平滑 3.1 數據平滑度方法 3.1.1加1法 3.1.2減 1.句子的先驗概率 這個聯合概率太小了 窗口越大,共現的可能性越小 參數多 解決:等價類 不看所有的歷史信息 只看部分歷史信息,但看所有的歷史等價 如何劃分等價類 將兩個歷史映射到同一個等價類,當且僅當這兩個歷史中的最近 n-1 個基元相同,即: 1.1 n-
相關文章
相關標籤/搜索