Word Vector的綜述

歷史 詞向量大致經過3個時期: 最早在做檢索系統,或者推薦系統時候,需要計算query和文檔,或者user和文檔之間的相關性,涉及到相關性,很直觀的利用到了向量的歐式距離活着餘弦距離。所以這個時期的向量化主要是基於整體數據的矩陣分解,使用的是整體數據的global信息。 詞向量的是一個主題迴歸的過程,相同主題的詞的向量彼此就比較接近。 分佈式語義的表示,使用機器學習的方式,然後選擇合適的學習目標,
相關文章
相關標籤/搜索