無監督數據場景下信息抽取問題

筆者現在有一批DWPI的專利數據,內含每一項專利的標題和摘要,時間跨度從2010-2020年,共計17萬條。現操作要求是對每一項專利的標題進行關鍵技術術語抽取。如 此任務爲探索性任務,筆者希望能用此博客記錄下探索過程中的思考和成效。 探索一,將此任務轉化爲了術語標註問題,即自動對術語進行BIO的標註,然後再對標註好的短語做抽取。在此任務框架下,筆者想要先試試已經訓練好的幾個模型,直接得到標註好的結
相關文章
相關標籤/搜索