Fine-tune BERT for Extractive Summarization中文數據集LCSTS復現

目前有關於Fine-tune BERT for Extractive Summarization代碼只有英文數據集,未曾包含中文LCSTS的數據集,疫情在家期間嘗試將代碼轉換到中文數據集中。 ** 一、數據轉換篇 ** 根據源代碼中對數據格式的要求,一個story文件中包含原文和摘要,以@highlight進行區分。 所以我們首先需要將原LCSTS數據集進行轉換,原數據集的格式如下:經過轉換後的數
相關文章
相關標籤/搜索