構建中文知識圖譜關鍵技術和流程

構建流程 知識抽取 實體識別 實體指的是某一具體事物。如具體的某一人名、地名、書名、學科名等。有如下三種方法來進行實體識別。 基於(百度、維基)百科 如我們可以根據百度百科爬取我們需要的垂直領域或開放域的實體。 基於統計機器學習 KNN + CRF 2)監督+規則 基於深度學習 1)Bi-LSTM + CRF 2)BERT-NER 開放域的實體抽取 基於已知實體的語義特徵去搜索日誌中識別出命名的實
相關文章
相關標籤/搜索