可視化詞向量-TSNE

可視化詞向量的好處是可以驗證訓練的詞向量的效果,常採用TSNE方法可視化。 t-分佈領域嵌入算法,它只用於已標註數據時才真正有意義,可以明確顯示出輸入的聚類狀況。 主要想法是將高維分佈點的距離用條件概率來表示相似性,同時低維分佈的點也是這樣表示。只要二者的條件概率非常接近(用相對熵來訓練,所以需要label),那就說明高維分佈的點已經映射到低維分佈上了。   難點: 1.高維距離較近的點,比較方便
相關文章
相關標籤/搜索