統計自然語言處理（詞彙獲取）

時間 2021-01-02

標籤自然語言處理简体版

原文原文鏈接

概述詞彙獲取的一般目的，通過考察大型文本語料庫中詞彙出現的模式，設計一種算法和統計技術來填補現有電子詞典的不足。在自然語言中我們感興趣的大部分詞的特性並沒有被收錄到電子詞典中，自然語言的新詞和舊詞新用法總是層出不窮，即使我們編輯了現有所有存在的詞彙，過幾天也會有新的出現，所以詞彙獲取在自然語言中則顯得十分重要。本章包含４個部分：動詞子範疇，附着歧義，選擇傾向，詞彙之間的語義相似性。可以看到之前談

>>阅读原文<<