Content to Node: Self-Translation Network Embedding

 
STNE:自翻譯網絡嵌入
該工做認爲在節點屬性與結構信息再本質上是有必定聯繫的,提出 STNE 模型,利用 seq2seq 模型進行特徵提取,將利用節點信息及網絡結構識別節點的過程比喻爲翻譯的過程

1. 簡介

目的:學習網絡中節點的低維表示
將利用節點信息及網絡結構識別節點的過程比喻爲翻譯的過程
 
論文引用網絡中,每一個節點表明一篇論文,每條邊表明引用關係。每一個節點自身屬性包括文章的摘要,關鍵詞,研究領域等等。該論文的假設依據是,論文所造成的引用網絡與論文自身的屬性之間有較強關係
 
現有方案
1. 將結構信息和屬性信息分別進行embedding以後,組合
2. 考慮短距離/固定鄰域範圍保留結構信息(第一/二鄰近)
(複雜問題中很難肯定鄰域範圍)
 

2. 創新點(貢獻):

提出基於seq2seq 的模型框架(STNE)
利用網絡上隨機遍歷生成的序列,將節點內容信息翻譯成結構信息,從而結合兩種信息
 
  • 將網絡嵌入轉化爲 seq2seq 任務,從局部建模到序列的全局結構建模,捕獲更多語義信息
  • 設計了一個異構的seq2seq 模型,嵌入原始輸入文本,以端到端的方式學習從節點屬性序列到節點指示序列的映射
對比
  • 與傳統方法相比, STNE 直接節點序列對建模,從文本序列中自動學習生成函數,將 seq2seq 網絡模型與其餘文本嵌入模型相結合,經過學習內容序列到節點序列的映射,將內容信息和結構信息無縫融合到隱藏層的潛在向量中,高效表示節點
  • 根據與節點的不一樣交互提出上下文感知嵌入
  • 相對於 CANE: 從相鄰文本節點感知嵌入
  • STNE:針對不一樣序列學習動態的節點嵌入(須要更長範圍,更靈活的上下文)

3. 模型框架

STNE 整體框架

 

 
圖一整體框架:
1. 給定內容豐富的網絡,經過隨機遊走提取節點序列,並將節點序列分爲兩個部分
  • 節點屬性序列
  • 節點指示序列(由節點指示向量 one-hot 表示)
2. 經過這兩個序列學習特定的 seq2seq 模型,該模型能夠用於將節點屬性「翻譯」爲節點指示向量
3. 步驟二的目的是獲得中間層的潛在轉換( 是可用於複雜網絡分析 )

4. 方法過程

 
由圖2 可看出,該過程爲:
  • 節點屬性---->低維表示( Encoder )
  • 低維表示---->節點序列( Decoder )
 
並行序列 S 包含:
節點身份序列 Si 和 相關內容序列 Sc
(使用並行序列將網絡嵌入轉化爲機器翻譯問題,從內容到節點的異構自翻譯過程)
 
映射函數 Sc->Si

 

 更詳細的總結
相關文章
相關標籤/搜索