直播預告|ACL 2020最佳論文|不止於準確性:使用CheckList爲NLP模型的進行行爲測試...

Beyond Accuracy: Behavioral Testing of NLP Models with CheckList 2020年7月29日 20:00-21:00 NLP模型最常見的評估方式——留出法 (held-out)——通常會會高估模型的泛化能力 (generalization);而現有的其他評估方法通常只針對某一特定任務或某種特定的模型行爲。 受軟件工程行爲測試原理的啓發,講者
相關文章
相關標籤/搜索