《科學》封面:人工智能終於能像人類同樣學習 zz

原文地址:http://tech.sina.com.cn/d/i/2015-12-12/doc-ifxmpnqi6368668.shtmlhtml

science   Human-level concept learning through probabilistic program inductiongit

原文地址:http://science.sciencemag.org/content/350/6266/1332github

github:https://github.com/brendenlake/BPL算法

 

本文經機器之心(微信公衆號:almosthuman2014)受權轉載,禁止二次轉載微信

   做者:汪汪app

  今天,《科學》雜誌封面刊登了一篇重磅研究:人工智能終於能像人類同樣學習,並經過了圖靈測試。機器學習

  這我的工智能像你同樣學習寫字性能

  假設你歷來沒有見過菠蘿。有一天,有人送了你一個菠蘿。儘管你這輩子只見過這一個菠蘿,但你只用一眼就看出了菠蘿的特徵。次日,你去水果店,很快就能從一堆蘋果、葡萄、柚子中認出菠蘿來。你甚至還能在紙上畫出菠蘿的簡筆畫。學習

  這種‘僅從一個例子就造成概念’的能力對人來講很容易。然而,儘管人工智能近年來取得了長足的進步,但要讓機器作到這一點,卻難於上青天,由於目前的人工智能一般須要從大量的數據中進行學習,你得讓它當作千上萬張菠蘿的圖片才行。測試

  不過,這個事實或許從今天開始改變了。今天,一篇人工智能論文登上了《科學》雜誌的封面,爲人們帶來了人工智能領域的一個重大突破:三名分別來自麻省理工學院、紐約大學和多倫多大學的研究者開發了一個‘只看一眼就會寫字’的計算機系統。(論文Human-level concept learning through probabilistic program induction見文末,或回覆12可下載pdf格式。)

  《科學》雜誌封面

  只需向這個系統展現一個來自陌生文字系統的字符,它就能很快學到精髓,像人同樣寫出來,甚至還能寫出其餘相似的文字——更有甚者,它還經過了圖靈測試。下面就是機器和人寫出的字符。你猜哪些是機器寫出來的?傻傻分不清了吧?

  機器的做品是1,2;2,1;1,1

  這三名研究者分別是紐約大學數據科學中心的Brenden Lake,多倫多大學計算機科學與統計學系的Ruslan Salakhutdinov和麻省理工學院大腦與認知科學系的Joshua Tenenbaum。他們創造的AI系統可以迅速學會寫陌生的文字,從某種意義上說明它領悟到了字符的本質特徵(也就是字符的總體結構),同時還能識別出非本質特徵(也就是那些因書寫形成的輕微變異)。

  三名研究者從左到右分別是:Ruslan Salakhutdinov, Brenden Lake和Joshua B。 Tenenbaum。圖/Alain Decarie/The New York Times

  人類的概念具備極大的彈性,所以,儘管許多概念的邊界十分模糊,但咱們依然能進行明確的分類。這三位研究者聲稱,他們的系統就抓住了這種彈性。該系統能模仿人類的一個特殊天賦——從少許案例中學習新概念。它所根植的計算結構叫作機率程序(probabilistic program),還可能有助於對人類得到複雜概念的過程進行建模。

  Joshua B。 Tenenbaum是麻省理工學院大腦與認知科學系的教授,他說:‘目前的人工智能領域大都聚焦在對模式進行分類。可是,這種類型的智能所缺乏的不是分類或識別的能力,而是思考。因此,儘管咱們研究的只是手寫字符,但依然大言不慚地使用「概念」這種詞。由於咱們能用字符來研究更加豐富和複雜的概念。咱們能理解字符的來歷和構件,也能理解如何用不一樣的方式來使用字符,並造出新的字符來。’

  經過‘圖靈測試’

  這篇論文的第一做者Brenden Lake曾在Tenenbaum的團隊中得到認知科學博士學位,現在他是紐約大學的博士後。根據Lake的介紹,他們在論文中分析了三個核心原則。這些原則都很通用,既能夠用在字符上,也能夠用在其餘的概念上:

  組合性(compositionality):表徵是由更簡單的基元構建而成。

  因果性(causality):模型表徵了字符生成的抽象因果結構。

  學會學習(learning to learn):過去的概念知識有助於學習新的概念。

  研究者對這個AI系統進行了幾項測試。

  測試1:研究者向它展現了它從未見過的書寫系統(例如藏文)中的一個字符例子,並讓它寫出一樣的字符。這裏並非讓它複製出徹底相同的字符,而是讓它寫出9個不一樣的變體,就像人每次手寫的筆跡都不相同同樣。例如,在看了一個藏文字符以後,算法挑選出該字符用不一樣的筆跡寫出來的例子,識別出組成字符的筆畫,並重畫出來。

  測試2:研究者向系統展現了一個陌生書寫系統中的幾個不一樣的字符,並讓它創造出一些類似的字符。

  測試3:研究者讓它在一個假定的書寫系統中創造出全新的字符。

  與此同時,人類被試也被要求作一樣的事情。最後,研究者要求一組人類裁判(來自亞馬遜土耳其機器人,Amazon Mechanical Turk)分辨出哪些字符是機器寫的,哪些是人類寫的。結果,裁判的正確率僅爲52%,和隨機的結果差很少。因而,機器經過了所謂的視覺圖靈測試。

  紅圈標出的是機器的做品

  傳統的機器學習系統(好比手機上的語音識別算法)在某些分類任務上的表現很好,但它們首先須要大量的數據集來進行訓練。相比之下,人類只須要少許的例子就能抓住某個概念的精髓。這種‘一次性學習’正是研究者但願他們的系統能模擬的能力。

  學會如何學習

  三位研究者採用的方法是‘貝葉斯程序學習’(BPL,Bayesian Program Learning),能讓計算機系統對人類認知進行很好的模擬。傳統的機器學習方法須要大量的數據來訓練,而這種方法只須要一個粗略的模型,而後使用推理算法來分析案例,補充模型的細節。

  在這篇論文中,研究者的模型只規定了字符由筆畫組成,筆畫由擡高筆觸來區分,而筆畫又由更小的子筆畫組成,子筆畫用筆尖速度爲零的點來區分。

  有了這個初始模型以後,研究者向AI展示了人類手寫文字的方式,包括筆畫順序等,讓系統學習連續的筆畫和子筆畫之間的統計關係,以及單個筆畫所能容忍的變異程度。這個系統從未在它所分析的書寫系統上進行過任何訓練,它只是推理出了人類寫字的通常規律。

  Tenenbaum說:‘每一個星期,咱們彷佛都能讀到機器在人臉識別、語音識別方面與人類旗鼓至關的新聞。可是,對我這種研究心智的科學家來講,機器學習和人類學習之間的鴻溝是巨大的。咱們但願彌合這個鴻溝,這是咱們的長期目標。’

  各方評價

  劍橋大學的信息工程教授Zoubin Ghahramani說:‘我認爲這對人工智能、認知科學和機器學習是一個重大的貢獻。深度學習目前已取得了重要的成功,這篇論文很是清醒地代表了深度學習的侷限性,由於深度學習須要大量的數據,而且在這篇論文所描述的任務上表現不好。這篇論文也展示了實現類人機器學習的重要方法。’

  也有一些人對‘人工智能超越人腦’這種說法持謹慎態度。艾倫人工智能研究所的Oren Etzioni說:‘我對「超人的表現」這種說法很是謹慎。固然,這個算法確實超過通常人的表現,除了達斯汀·霍夫曼。’(指霍夫曼主演的《雨人》電影。)

  與深度學習優點互補

  多倫多大學和谷歌的人工智能先驅Geoffrey Hinton說這個研究‘使人印象很是深入’。他說,這個模型能經過視覺圖靈測試,這很重要,‘是一個不錯的成就。’Hinton是深度學習的奠定者。深度學習近年來取得了舉世矚目的成就,被普遍應用在許多領域,例如語音翻譯、圖像識別等,還用在谷歌的圖像搜索和Facebook的人臉識別上,得到了巨量的數據以供學習。

  Hinton說,這篇論文最使人興奮的成果或許是能讓那些宣稱智能計算機系統的學習方式與人類徹底不一樣的批評者閉嘴,由於他們的主要論據正是計算機不能從單個例子中造成概念。

  將來

  在將來,這種機器學習的技術可以完成不少任務,例如讀懂手語、提高語音識別軟件的性能等。運用這種方法,或許只用向計算機展現一張人臉照片,它就能從任何角度識別出這我的。它甚至有可能用來制定軍事行動計劃。

  固然,儘管這個成果很重要,但它對人工智能領域來講只是一個小小的起點,不表明將來的機器學習都必須採用這種方法。正如它顛覆了‘計算機如何理解概念’這個課題同樣,在這個突飛猛進的領域中,極有可能下個月就出現一種新方法,將它甩在後面飛揚的塵土中。

相關文章
相關標籤/搜索