知識圖譜學習小記

時間 2020-07-19

標籤知識圖譜學習简体版

原文原文鏈接

1、知識圖譜的架構（邏輯結構+體系架構）

1.1 知識圖譜的邏輯結構（數據層+模式層）

數據層主要是由一系列的事實組成，而知識將以事實爲單位進行存儲。若是用(實體1，關係，實體2)、(實體、屬性，屬性值)這樣的三元組來表達事實，可選擇圖數據庫做爲存儲介質，例如開源的Neo4j、Twitter的FlockDB、sones的GraphDB等。
模式層構建在數據層之上，主要是經過本體庫來規範數據層的一系列事實表達。本體是結構化知識庫的概念模板，經過本體庫而造成的知識庫不只層次結構較強，而且冗餘程度較小。數據庫

1.2 知識圖譜的體系架構（自頂向下top-down+自底向上bottom-up）

自頂向下指的是先爲知識圖譜定義好本體與數據模式，再將實體加入到知識庫。該構建方式須要利用一些現有的結構化知識庫做爲其基礎知識庫。
自底向上指的是從一些開放連接數據中提取出實體，選擇其中置信度較高的加入到知識庫，再構建頂層的本體模式。目前，大多數知識圖譜都採用自底向上的方式進行構建。網絡

2、知識圖譜的關鍵技術（知識抽取、知識表示、知識融合、知識推理等）

2.1 知識抽取（實體抽取+關係抽取+屬性抽取）

知識抽取主要是面向開放的連接數據，經過自動化的技術抽取出可用的知識單元，知識單元主要包括實體(概念的外延)、關係以及屬性3個知識要素。架構

2.2 知識表示（實體和關係的分佈式表示）

雖然基於三元組的知識表示形式受到了普遍承認，可是其在計算效率、數據稀疏性等方面卻面臨着諸多問題。近年來，以深度學習爲表明的表示學習技術取得了重要的進展，能夠將實體的語義信息表示爲稠密低維實值向量，進而在低維空間中高效計算實體、關係及其之間的複雜語義關聯。框架

2.3 知識融合（實體對齊+知識加工+知識更新）

因爲知識圖譜中的知識來源普遍，存在知識質量參差不齊、來自不一樣數據源的知識重複、知識間的關聯不夠明確等問題，因此必需要進行知識的融合。知識融合是高層次的知識組織，使來自不一樣知識源的知識在同一框架規範下進行異構數據整合、消歧、加工、推理驗證、更新等步驟，達到數據、信息、方法、經驗以及人的思想的融合，造成高質量的知識庫。分佈式

2.4 知識推理（基於邏輯的推理與基於圖的推理）

知識推理則是在已有的知識庫基礎上進一步挖掘隱含的知識，從而豐富、擴展知識庫。在推理的過程當中，每每須要關聯規則的支持。因爲實體、實體屬性以及關係的多樣性，人們很難窮舉全部的推理規則，一些較爲複雜的推理規則每每是手動總結的。對於推理規則的挖掘，主要仍是依賴於實體以及關係間的豐富同現狀況。知識推理的對象能夠是實體、實體的屬性、實體間的關係、本體庫中概念的層次結構等。學習