信息提取(Information Extraction)

信息提取(IE) 信息提取(IE)的目標是將文本信息轉化爲結構化信息,起初用於定位自然語言文檔中的特定信息,屬於自然語言處理的一個子領域。 隨着網頁文本信息的急劇增長,越來越多的人投入到信息提取(IE)領域的研究。 網頁文本信息的非結構化特徵和無序性,一般只能採用全文檢索的方式查找。但是網頁中充斥着大量的無關信息,比如廣告和無關鏈接以及其他內容,有用信息和無用信息混雜在一起,給網頁信息的檢索問題帶
相關文章
相關標籤/搜索