信息檢索模型與評估

信息檢索的前提是對信息內容的索引提取,所謂的索引就是指用於標識信息內容的項。創建信息的索引的方法,一般可分爲兩類:一種是手動定義索引,一種是自動獲取索引。而咱們所要面臨的數據源,既多是模塊化或結構化的語言,譬如HTML語言,又多是非結構化的語言,譬如天然語言;既多是與上下文相關的詞彙,又多是與上下文無關的詞彙;既多是一個簡單的單詞又多是一個詞組(這裏的數據源前提假設爲英文,對於中文的信息檢索,因爲
相關文章
相關標籤/搜索