Wikitext-103-數據集

本數據集是超過 1 億個語句的數據合集,全部從維基百科的 Good 與 Featured 文章中提煉出來。廣泛用於語言建模,當中 包括 fastai 庫和 ULMFiT 算法中經常用到的預訓練模型。 Recent neural network sequence models with softmax classifiers have achieved their best language mod
相關文章
相關標籤/搜索