數據層主要是由一系列的事實組成,而知識將以事實爲單位進行存儲。若是用(實體1,關係,實體2)、(實體、屬性,屬性值)這樣的三元組來表達事實,可選擇圖數據庫做爲存儲介質,例如開源的Neo4j、Twitter的FlockDB、sones的GraphDB等。
模式層構建在數據層之上,主要是經過本體庫來規範數據層的一系列事實表達。本體是結構化知識庫的概念模板,經過本體庫而造成的知識庫不只層次結構較強,而且冗餘程度較小。數據庫
自頂向下指的是先爲知識圖譜定義好本體與數據模式,再將實體加入到知識庫。該構建方式須要利用一些現有的結構化知識庫做爲其基礎知識庫。
自底向上指的是從一些開放連接數據中提取出實體,選擇其中置信度較高的加入到知識庫,再構建頂層的本體模式。目前,大多數知識圖譜都採用自底向上的方式進行構建。網絡
知識抽取主要是面向開放的連接數據,經過自動化的技術抽取出可用的知識單元,知識單元主要包括實體(概念的外延)、關係以及屬性3個知識要素。架構
雖然基於三元組的知識表示形式受到了普遍承認,可是其在計算效率、數據稀疏性等方面卻面臨着諸多問題。近年來,以深度學習爲表明的表示學習技術取得了重要的進展,能夠將實體的語義信息表示爲稠密低維實值向量,進而在低維空間中高效計算實體、關係及其之間的複雜語義關聯。框架
因爲知識圖譜中的知識來源普遍,存在知識質量參差不齊、來自不一樣數據源的知識重複、知識間的關聯不夠明確等問題,因此必需要進行知識的融合。知識融合是高層次的知識組織,使來自不一樣知識源的知識在同一框架規範下進行異構數據整合、消歧、加工、推理驗證、更新等步驟,達到數據、信息、方法、經驗以及人的思想的融合,造成高質量的知識庫。分佈式
知識推理則是在已有的知識庫基礎上進一步挖掘隱含的知識,從而豐富、擴展知識庫。在推理的過程當中,每每須要關聯規則的支持。因爲實體、實體屬性以及關係的多樣性,人們很難窮舉全部的推理規則,一些較爲複雜的推理規則每每是手動總結的。對於推理規則的挖掘,主要仍是依賴於實體以及關係間的豐富同現狀況。知識推理的對象能夠是實體、實體的屬性、實體間的關係、本體庫中概念的層次結構等。學習