兒童讀物的數據集清洗(三)

兒童讀物的數據集清洗 1.完成全部數據集的清洗 2.合併數據集 3.to do list 1.完成全部數據集的清洗 根據昨天的數據集清洗方法,清洗完成全部的數據集 如下所示: 2.合併數據集 將不容的小故事的數據集合併成一個txt文件 這些數據將做爲訓練數據集進行標點符號的預訓練 3.to do list 處理小學生作文數據集,隨機生成錯誤的標點符號,形成小學生含錯誤標點的樣本。
相關文章
相關標籤/搜索