800萬中文詞,騰訊AI Lab開源大規模NLP數據集

參加 2018 AI開發者大會,請點擊 ↑↑↑ 10 月19 日,騰訊 AI Lab 宣佈開源大規模、高質量的中文詞向量數據。該數據包含 800 多萬中文詞彙。 騰訊 AI Lab 表示,相比現有的公開數據,該數據在覆蓋率、新鮮度及準確性上大幅提高,爲對話回覆質量預測和醫療實體識別等自然語言處理方向的業務應用帶來顯著的效能提升。 ▌騰訊 AI Lab 詞向量的特點 騰訊 AI Lab 此次公開的中
相關文章
相關標籤/搜索