語言模型:Trigram-模型的平滑估計

作者:chen_h 微信號 & QQ:862251340 微信公衆號:coderpai 該系列將描述一些自然語言處理方面的技術,完整目錄請點擊這裏。 正如我們前面討論的,三元語言模型有非常多的參數。利用最大似然估計會造成一個很嚴重的問題,就是很多的值都會變成零,數據將會非常稀疏。即使我們把訓練集設置的非常大,但是很多的三元組 c(u, v, w) 或者二元組 c(u, v) 的值還是會很小或者等於
相關文章
相關標籤/搜索