信息檢索筆記 (3)

概率信息檢索模型: 1、找到相關文檔集合。 2、估計概率相關模型 3、對文檔進行概率估計。 用一個相對值來評價文檔相似度。 看一下判斷錯誤得概率: 對每一種決策錯誤給予決策錯誤得代價: BIR:爲了得到概率的估計而得到的概率模型 1、講文檔拆成若干個向量。 當維度所對應的di所對應的term不在document裏,則爲0,否則爲1. 定義pi: 一個相關文檔包含第i個term的概率。 pi: 一個
相關文章
相關標籤/搜索