阿里妹導讀:知識圖譜的構建技術主要有自頂向下和自底向上兩種。其中自頂向下構建是指藉助百科類網站等結構化數據源,從高質量數據中提取本體和模式信息,加入到知識庫裏。而自底向上構建,則是藉助必定的技術手段,從公開採集的數據中提取出資源模式,選擇其中置信度較高的信息,加入到知識庫中。網站
在本文中,筆者主要想分享一下自底向上構建知識圖譜的全過程,拋磚引玉,歡迎你們交流。資源
「The world is not made of strings , but is made of things.」
——辛格博士,from Google.get
知識圖譜,是結構化的語義知識庫,用於迅速描述物理世界中的概念及其相互關係,經過將數據粒度從document級別降到data級別,聚合大量知識,從而實現知識的快速響應和推理。string
當下知識圖譜已在工業領域獲得了普遍應用,如搜索領域的Google搜索、百度搜索,社交領域的領英經濟圖譜,企業信息領域的天眼查企業圖譜等。class
2842041297.png基礎
在知識圖譜技術發展初期,多數參與企業和科研機構主要採用自頂向下的方式構建基礎知識庫,如Freebase。隨着自動知識抽取與加工技術的不斷成熟,當前的知識圖譜大多采用自底向上的方式構建,如Google的Knowledge Vault和微軟的Satori知識庫。閱讀全文請點擊cli