Wikitext-103-數據集

時間 2021-01-22

標籤下載數據集 WikiText 語料庫简体版

原文原文鏈接

本數據集是超過 1 億個語句的數據合集，全部從維基百科的 Good 與 Featured 文章中提煉出來。廣泛用於語言建模，當中包括 fastai 庫和 ULMFiT 算法中經常用到的預訓練模型。 Recent neural network sequence models with softmax classifiers have achieved their best language mod

>>阅读原文<<