知識圖譜實戰(四)

交叉確認集是從訓練集中抽取一部分用來調整模型參數 模型構建的時候一定要選用跟模型相匹配的數據 其中,未登錄詞是指當下出現的新詞,未納入詞典中的詞 例如:X爲電影 ,Y爲院,通過公式計算X與Y的凝聚程度,較大則爲一個詞,反之不是 一般採用默認模式(精確模式),不採用全模式, 精確模式:會將這句話中的詞進行切割, 全模式:只要是單詞就會顯示 IDF的作用就是爲了凸顯出在文章當中出現的在其他文章當中出現
相關文章
相關標籤/搜索