大規模知識圖譜數據流設計

知識圖譜的數據量,更新方式,使用場景的不同,決定其數據流如何設計。 在應用有着上億級別的節點數,數據存在着離線批量更新以及用戶實時手工修改兩種方式,使用場景也有着圖查詢以及模糊的搜索查詢。這樣就決定着數據流設計如下圖: 分別介紹其中的功能模塊: (1)圖數據庫 採用圖數據庫來存儲知識圖譜的數據,圖數據庫天然地滿足節點–>關係–>節點這種存儲格式。目前業界多使用neo4j,titan等,使用分佈式圖
相關文章
相關標籤/搜索