PKU Paraphrase Bank文章筆記:句級中文文本複述語料庫

前兩天查文本複述的資料的時候發現9月30號北大release了一批中文文本複述語料,就去看了一下,發現這篇文章用的方法都比較經典,易於理解,在這裏做一個總結。 文章目錄 文本複述定義 語料庫概況 數據來源 數據規模 無監督語料庫生成方法 流程概覽 數據預處理 分數模型 整體模型 SCORE函數之完全匹配得分 SCORE函數之語義得分 SCORE函數的線性組合 計算的優化 位置限定 快速剪枝 語料庫
相關文章
相關標籤/搜索