本論文由騰訊 AI Lab 主導,和廈門大學、西湖大學合做完成。做者提出基於「多視角重建」的損失函數提高文本生成的質量和忠實度,與此同時並無增長任何模型參數。函數
Structural Information Preserving for Graph-to-Text Generation性能
圖到文本生成(graph-to-text generation)任務有着普遍的潛在應用,而且已經被應用在機器翻譯等任務中。下圖顯示了兩種圖結構(語義圖和知識圖譜),分別表示「The boy wants the beautiful girl to eat lunch with him.」和「Above the Veil is an Australian novel and the sequel to Aenir. It was followed by Into the Battle.」學習
現有的該領域工做不斷的提出更強大的模型來表示圖信息,但模型依然是經過擬合到目標文本的基於語言模型(language modeling loss)的損失函數進行訓練的,做爲結果,模型會產生流暢的輸出,但會丟失許多輸入的重要信息。編碼
本文提出了一種通用的基於「多視角重建」的損失函數來輔助模型訓練。總的來講,咱們提出了多種方法把輸入的圖投射到目標句子端,讓解碼器不只學習輸出目標句子,還要輸出投射的圖結構,這樣可以迫使模型在作生成的時候更好的記住輸入內容。spa
上圖展現了咱們的模型,其中「Encoder-Decoder」表明一種「structural-aware transformer」 的模型,它在多個圖到文本生成任務重取得了最好的性能,它用右側的基於語言模型的損失函數來訓練。咱們提出兩種「多視角重建」的損失函數,它們都是從解碼器端進行計算,這樣可以強化整個模型的訓練(而不是隻有編碼器)。其中第一種視角(View 1)展示了圖投射在目標語言上的形態,它相似於依存樹,咱們用額外的Deep Baffine模型對它進行建模;另外第二種視角(View 2)展現了線性化後的圖,咱們用一個標準的餓Transformer Decoder對它進行建模,最後對三部分損失加權獲得最終的損失:翻譯
爲了驗證做者在三個圖到文本的標準數據集(LDC2015E86,LDC2017T10,WebNLG)上進行驗證,分別取得了2.4+ BLEU score的提高,分別見表一、二、3,更多分析結果請參考原文code
表1: LDC2015E86上的結果orm
表2: LDC2017T10上的結果blog
表3: WebNLG上的結果it