FreeDOM —— 一個可遷移的網頁信息抽取模型

⬆⬆⬆ 點擊藍字 關注我們 AI TIME歡迎每一位AI愛好者的加入! 在網頁中抽取結構化信息是一種非常重要的知識獲取(Knowledge Discvoery)方式。爲了構建一個領域的知識圖譜,往往需要從涉及這個領域的衆多網站中抽取結構化信息,從而促進知識庫的補全和擴展。然而,每個網站都有不同的結構和對應的抽取規則(wrapper),如果用人力來編寫每個網頁獨自使用的規則,那麼效率會大打折扣。爲此
相關文章
相關標籤/搜索