【計算機科學】【2018.09】基於主動學習的文本分類

時間 2021-01-10

原文原文鏈接

本文爲荷蘭埃因霍芬理工大學（作者：Šostak, T.）的碩士論文，共51頁。缺乏足夠的訓練數據一直是機器學習中的一個問題。即使有足夠的數據，數據仍然需要由領域專家手動註釋來構建模型。主動學習通過減少構建足夠模型所需的標記數據量來加快註釋過程，從而節省了人工註釋者的成本和時間。這篇論文將在不同的數據集上對已有的和新的主動學習方法進行基準測試，並提出一個主動學習系統的實現。這些數據集包含文本形式

>>阅读原文<<