圖卷積神經網絡GCN-在交通預測中考慮網絡拓撲 STGCN-A Deep Learning Framework for Traffic

論文:Spatio-Temporal Graph Convolutional Networks A Deep Learning Framework
for Traffic
出處:IJCAI 2018

大體思路:使用Kipf & Welling
2017的近似譜圖卷積得到的圖卷積作爲空間上的卷積操作,時間上使用一維卷積對所有頂點進行卷積,兩者交替進行,組成了時空卷積塊,在加州PeMS和北京市的兩個數據集上做了驗證。但是圖的構建方法並不是基於實際路網,而是通過數學方法構建了一個基於距離關係的網絡。原文鏈接:Spatio-Temporal
Graph Convolutional Networks: A Deep Learning Framework for Traffic
Forecasting

具體內容解釋[轉]:csdn博客

核心思想:模型融合+時空特徵提取+全卷積模塊

RELATED WORK:

[Wu and Tan, 2016] Yuankai Wu and Huachun Tan. Shortterm traffic flow forecasting with spatial-temporal correlation in a hybrid deep learning framework. arXiv preprint arXiv:1612.01022, 2016.

[Shi et al., 2015] Xingjian Shi, Zhourong Chen, Hao Wang, Dit-Yan Yeung, Wai-Kin Wong, and Wang-chun Woo. Convolutional lstm network: A machine learning approach for precipitation nowcasting. In NIPS, pages 802–810, 2015.

使用RNN/LSTM的缺陷:需要迭代訓練,逐步引入了錯誤累積,同時加大了訓練難度。

在該論文中提出了一種新的深度學習結構,時空圖卷積網絡,用於交通預測任務。該體系結構由多個時空卷積塊組成,時空卷積塊由圖卷積層和卷積序列學習層組合而成(參考論文Convolutional neural networks on graphs with fast localized spectral filtering),對時空依賴關係進行建模。這是第一次使用圖卷積神經網絡結構進行交通預測。

模型結構:

重點:抽取時間特徵的門控捲積神經網絡

時間卷積層包含了一個一維卷積,核的寬度爲Kt,之後接了一個門控線性單元(GLU)作爲激活。對於圖中的每個頂點,時間卷積對輸入元素的Kt個鄰居進行操作,不帶填充,使得每次將序列長度縮短Kt-1。

因此,輸入(每個節點)可被描述爲長度爲M,通道數爲Ci(這裏Ci=1)的序列。輸入Y∈R^(M* Ci)。
卷積核:
Γ R K t × C i × 2 C o \varGamma \in \mathbb{R}^{K_t\times C_i \times 2C_o}

作用:將輸入Y映射到一維輸出。

卷積公式:

Γ τ Y = P σ ( Q ) R ( M K t + 1 ) × C o \varGamma *_\tau Y = P\odot \sigma(Q)\in \mathbb{R}^{(M-K_t+1)\times C_o}

其中P、Q分別是GLU中門的輸入,⊙表示逐元素的Hadmard乘積。sigmoid門σ控制當前狀態的那個輸入對於發現時間序列中的組成結構和動態方差是相關的。

相似地,通過將卷積核應用到圖中所有節點,可以將時間卷積擴展到3維。

句子建模之門控CNN

重點:時空卷積塊

v l + 1 = Γ τ R e L U ( Θ l G ( Γ 0 l τ v l ) ) v^{l+1}=\Gamma*_\tau ReLU(\Theta^l*_\mathcal{G}(\Gamma_0^l*_\tau v^l))

使用L2損失來衡量效果。
在這裏插入圖片描述

  • STGCN是處理結構化時間序列的通用框架。
  • 時空塊結合了圖卷積和門控時間卷積,可以提取最有用的時空特徵。
  • 該模型完全由卷積結構構成,因此實現了輸入的並行化,參數更少,訓練速度更快。

其他細節內容見論文。