文本分類——算法性能評估

內容提要 數據集 英文語料 中文語料 評估指標 召回率與準確率 F1-評測值 微平均與宏平均 混淆矩陣   優秀的文本分類模型必須經得住真實數據集的驗證,於是分類器必須在通用的數據集上進行測試。用於文本分類的數據集通常稱爲語料庫。   語料庫指經科學取樣和加工的大規模電子文本庫。藉助計算機分析工具,研究者可開展相關的語言理論及應用研究。語料庫中存放的是在語言的實際使用中真實出現過的語言材料;語料庫
相關文章
相關標籤/搜索