主動學習方法在臨牀命名實體識別應用的研究

主動學習實驗框架: 1. 初始化模型產生,一般是有兩種初始化抽樣策略:(a)隨機抽樣 (b)最長句子抽樣。 2. 查詢: 未標註句子然後基於查詢算法被排序。主要是uncertainty sampling 和diversity based algorithm。 排在前列的句子會被選擇用於標註。每次循環的batch size(前多少個句子被選中)被設作8,16,32,64,128.。。。 3. 訓練:
相關文章
相關標籤/搜索