分析高階問題

摘要:當前方法經常使用單階設定當處理序列標籤任務。在本工作中,order意味着標籤的個數,包含在每個時間步中的預測。高階模型試圖去捕獲更多依賴信息在這些標籤之間。我們首先提出一個簡單方法就是低階模型可以簡單的拓展到高階模型。驚奇的是,高階模型被認爲捕獲更多依賴信息當增加階數時表現更差。我們認爲強迫網絡去學習複雜結構會導致過擬合。爲了處理這個問題,我們提出一種方法能夠結合低階和高級信息一起去解碼。提
相關文章
相關標籤/搜索