342箇中、英文等NLP開源數據集分享

    本資源整理了342箇中文、英文等NLP相關的公開數據集,涉及文本分類、實體識別&詞性標註、搜索匹配、推薦系統、指代消歧、百科數據、預訓練詞向量or模型等。blog     由於涉及數據集較多,建議你們按關鍵字搜索須要數據集和paper,能夠去源網頁:https://datasets.quantumstat.com/資源       打不開原網頁的,能夠下載帶連接pdf資源,下載地址:pdf
相關文章
相關標籤/搜索