知識圖譜學習小記

1、知識圖譜的架構(邏輯結構+體系架構)

1.1 知識圖譜的邏輯結構(數據層+模式層)

數據層主要是由一系列的事實組成,而知識將以事實爲單位進行存儲。若是用(實體1,關係,實體2)、(實體、屬性,屬性值)這樣的三元組來表達事實,可選擇圖數據庫做爲存儲介質,例如開源的Neo4j、Twitter的FlockDB、sones的GraphDB等。
模式層構建在數據層之上,主要是經過本體庫來規範數據層的一系列事實表達。本體是結構化知識庫的概念模板,經過本體庫而造成的知識庫不只層次結構較強,而且冗餘程度較小。數據庫

1.2 知識圖譜的體系架構(自頂向下top-down+自底向上bottom-up)

自頂向下指的是先爲知識圖譜定義好本體與數據模式,再將實體加入到知識庫。該構建方式須要利用一些現有的結構化知識庫做爲其基礎知識庫。
自底向上指的是從一些開放連接數據中提取出實體,選擇其中置信度較高的加入到知識庫,再構建頂層的本體模式。目前,大多數知識圖譜都採用自底向上的方式進行構建。網絡

2、知識圖譜的關鍵技術(知識抽取、知識表示、知識融合、知識推理等)

2.1 知識抽取(實體抽取+關係抽取+屬性抽取)

知識抽取主要是面向開放的連接數據,經過自動化的技術抽取出可用的知識單元,知識單元主要包括實體(概念的外延)、關係以及屬性3個知識要素。架構

2.2 知識表示(實體和關係的分佈式表示)

雖然基於三元組的知識表示形式受到了普遍承認,可是其在計算效率、數據稀疏性等方面卻面臨着諸多問題。近年來,以深度學習爲表明的表示學習技術取得了重要的進展,能夠將實體的語義信息表示爲稠密低維實值向量,進而在低維空間中高效計算實體、關係及其之間的複雜語義關聯。框架

2.3 知識融合(實體對齊+知識加工+知識更新)

因爲知識圖譜中的知識來源普遍,存在知識質量參差不齊、來自不一樣數據源的知識重複、知識間的關聯不夠明確等問題,因此必需要進行知識的融合。知識融合是高層次的知識組織,使來自不一樣知識源的知識在同一框架規範下進行異構數據整合、消歧、加工、推理驗證、更新等步驟,達到數據、信息、方法、經驗以及人的思想的融合,造成高質量的知識庫。分佈式

2.4 知識推理(基於邏輯的推理與基於圖的推理)

知識推理則是在已有的知識庫基礎上進一步挖掘隱含的知識,從而豐富、擴展知識庫。在推理的過程當中,每每須要關聯規則的支持。因爲實體、實體屬性以及關係的多樣性,人們很難窮舉全部的推理規則,一些較爲複雜的推理規則每每是手動總結的。對於推理規則的挖掘,主要仍是依賴於實體以及關係間的豐富同現狀況。知識推理的對象能夠是實體、實體的屬性、實體間的關係、本體庫中概念的層次結構等。學習

知識表示學習方法

1. 距離模型、單層神經網絡模型、能量模型、雙線性模型、張量神經網絡模型、矩陣分解等基本模型

2. 基於TransE的多種變體模型(TransH, TransD, TransA, TransAH)

3. 其它(TorusE, ConvE, ConvKB, KBGAN)

相關文章
相關標籤/搜索