關於知識圖譜,咱們接下來該研究什麼?斯坦福教授們給出了答案

關於知識圖譜,咱們接下來該研究什麼?斯坦福教授們給出了答案

本文整理了斯坦福大學 CS 520 知識圖譜研討會課程的第 10 集的內容,主要是關於知識圖譜將來的研究方向,推薦給研究知識圖譜的同窗們~算法

1 使用強化學習進行多跳知識圖譜推理
第一位演講者:Richard Sochar網絡

Richard 認爲知識圖譜將來的一個重要研究方向是使用強化學習進行多跳知識圖譜推理。框架

關於知識圖譜,咱們接下來該研究什麼?斯坦福教授們給出了答案

知識圖譜的缺陷之一是不完整性,即知識圖譜能存儲的事實是有限的。對於知識圖譜的重要應用——聊天機器人(Chatbot),也就是對話系統或者問答系統,其交互形式能夠是文本或是圖像。在對話過程當中須要根據知識圖譜進行推理,但知識圖譜關於目標問題的知識多是殘缺或者有噪音的,因此算法應當具備必定的魯棒性。對於知識圖譜的不完整性,有如下解決方案:ide

知識圖譜嵌入
知識圖譜嵌入是一種發現缺失事實的有效方法。它將知識圖譜中的全部實體或關係嵌入到連續向量空間中。採用強化學習進行推理時,可使用知識圖譜嵌入,便於神經網絡對實體進行處理。可是知識圖譜嵌入一般缺乏可解釋性。工具

多跳推理模型
現有的多跳推理模型一般採用序列決策的思路。從問題中提取實體,而後在知識圖譜中學習如何在實體間進行推理。學習

強化學習框架
強化學習中須要關注五個要素:人工智能

  • 環境 environment:在該任務中,環境是一個知識圖譜
    狀態 state:例如,當前已經遍歷過的一個子圖
    動做 action:例如,選擇一個結點進行擴展
    轉換 transition:採起一個動做後,狀態發生改變,直到一個定義的推理終點
    獎勵 reward:在推理正確時得到獎勵
    使用強化學習進行推理可解釋性較強,能夠從算法給出的推理路徑中分析結果的產生緣由。
    關於知識圖譜,咱們接下來該研究什麼?斯坦福教授們給出了答案

多跳推理是可解釋的,可是準確較低。經常將知識圖譜嵌入與強化學習框架結合使用,從而兼顧可解釋性和準確性。blog

該方法還能夠推廣到聯合知識圖譜和文本的多跳推理上。開發

2 知識圖譜到底知道什麼?
第二位演講者:Mark A. Musen 博士it

Mark 想討論的是很是根本的一個問題——咱們知道了什麼是圖,但什麼是知識?咱們如何確保知識被存儲到了圖中?關於這個問題的答案,Mark從早年的研究歷史開始談起。

上世紀中葉,Stanford 想要開發一個專家系統,幫助醫生作臨牀決策。他們先是考慮用語義網絡來實現這一任務。還有一個早期用於幫助決策的專家系統,叫作MYCIN,出現於 70~80 年代。它是包含大量複雜的規則供專家進行決策。在這個年代,符號化的人工智能也被認爲是醫療健康行業的將來。可是,對這類方法的質疑逐漸顯現。包含大量規則的系統真的是能夠維護的嗎?語義網絡(知識圖譜)可以支持查找以外的任何形式的推理嗎?什麼樣的知識表示可能能夠支持一個最智能的系統呢?

Allen Newell 在 1980 年提出:咱們應該中止爭論如何表示知識,真正重要的是系統中有怎樣的知識,而不是如何用計算機進行表示。知識是觀察者賦予智能體的。知識是解決問題的能力

  • 咱們沒法「看見」知識,或將它寫下來。所謂「道可道,很是道。名可名,很是名。」
  • 咱們永遠沒法得知智能體到底懂得了什麼。所謂「子非魚,安知魚之樂。子非我,安知我不知魚之樂。」
  • 咱們只能認爲智能體有知識的條件是:
  • 彷佛有目標
  • 彷佛能選擇行爲能實現目標![]彷佛能選擇行爲能實現目標
  • 彷佛能理智地選擇行爲
    語義網被認爲有但願在 Web 級別的數據上解決問題。但Mark 認爲相關研究者彷佛忽視了本體論和 Web 服務的做用,只顧玩弄連接數據的概念。日益增加的連接數據被表示爲知識圖譜。正如上個世紀那樣,咱們又開始過度關注知識表示的狀態,而愈來愈少地討論如何利用它解決問題。只有圖,咱們仍然作不了任何事情。

咱們又從新開始研究如何將知識表示爲圖。現在,龐大的知識圖譜相比當年的語義網絡,擁有更加豐富的信息。咱們已經知道一些表示和生成智能行爲的方法了,但還有不少應用沒有開始研究,有不少行爲尚未想到如何去建模——這是咱們將來能夠努力的方向。

3 Data Commons
第三位演講者:RV Guha

數據正在驅動不少應用,政策、新聞、健康、科學等。目前的問題不在於數據的缺少,而是數據有太多的格式和規範。咱們搜尋數據源、清洗數據、搞定數據存儲……在這個過程當中存在啓動成本高昂,生態系統不完整,工具較少的問題。咱們如何使數據的使用變得更加簡單?

Data Commons 是一個 Google 發起的項目,嘗試解決知識圖譜構建中的上述問題,從不一樣數據源合成一個開放知識圖譜。Guha 團隊想要作的是,從本來搜索數據集、下載、清洗、歸一化、融合的繁瑣流程,簡化到直接搜索谷歌便可得到數據集。

該項目的優點在於,經過清洗、歸一化和將多個數據集進行融合的方式,輕鬆構建一個知識圖譜,無需清理和加入數據。

目前經過 Data Commons 構建的知識圖譜包括按地理區域的美國人口普查公報、美國國家海洋和大氣管理局提供的天氣歷史與預報、美國勞工統計局的就業與失業統計等。

以上是對課程的簡單的筆記,並不足以涵蓋課程中的細節,感興趣的同窗們能夠刷起來啦~

相關文章
相關標籤/搜索