摘要:本文對人工智能領域的一些基礎知識進行了普及。對剛剛接觸機器學習的人們會有不小的幫助
編程
在關注了機器學習一段時間之後,最近我開始投入到這個領域的研究中。去年,我開始學習天然語言處理的相關知識,並撰寫了一些這方面的文章。同時我開始更普遍地接觸機器學習理論,並主要專一於文本理解和文本處理。周圍一些對人工智能有興趣的朋友和同事時常會問我一些類似的問題,而我儘量地就我所知道的給予他們回答。由於在理解以及真正運用那些高深的數學知識以前,還要具有一些必要的基本概念。所以我也愈來愈意識到普及這些基礎知識的重要性和必要性。安全
「人工智能,機器學習,神經網絡,深度學習,到底有啥區別」,這是我經常被問及的一個話題。人工智能,機器學習,神經網絡,深度學習,它們是具備不一樣含義的四個術語。不過人們每每把它們交替使用。就個人理解,這樣的互換在大多數狀況都沒有太大的錯誤。不過準確的區分它們能夠幫助咱們瞭解行業的現狀與發展方向。網絡
人工智能(AI-Artificial intelligence )就是讓計算機幫助人類解決問題,它能夠被當作是這個領域的總稱。我將它區別於軟件工程。在軟件工程中,咱們更專一於如何編程,從而讓計算機執行某項任務。在今天,人工智能幾乎包含現實世界的方方面面,絕不誇張的說人工智能已經無處不在了。隨着現代化帶來的便利,有些已經被咱們習覺得常的事物,已經不會被你們當成是人工智能了。好比,路徑導航,聯想輸入,全文搜索等,這些咱們平常生活中經常用到的功能,在幾十年前它們就屬於人工智能的研究方向。而如今,這些技術只是被當成理所固然的了。(動物研究中也有相似的趨勢,「可以使用工具」曾經被認爲是智人的定義之一,可是當咱們發現「章魚也能打開罐子」或者「烏鴉竟能解決字謎」時,智人的這個標準也隨之被提高。一樣,咱們也能夠認爲人工智能主要是專一於那些計算機還不能熟練解決的問題。)
架構
機器學習(Machine Learning)咱們能夠把它看做人工智能的一個子集。 其中的核心是「學習」,而不是經過人來教會機器完成某項工做。機器學習系統是經過大量的樣本對計算機進行訓練,從而使機器獲取解決問題的能力,而不是直接告訴機器解決某個問題的方法。機器學習
咱們能夠把訓練機器學習系統比做教小朋友學習:咱們提供許多例子來對兒童進行訓練,並給他們足夠的反饋信息,讓他們知道是對仍是錯。一個更好的類比是訓練警犬 - 特別是訓練它們作一些人類能力範圍以外的任務,好比甄別炸彈等危險品。 咱們對警犬進行不少的訓練,可是咱們並不能準確地告訴它們如何作。咱們能作的只是每當他們找到目標之後,給予相應的獎勵。以後,它們就知道了哪些特徵對它們來講是能夠得到獎勵的,而這些反饋的結果等同於「找到了炸彈」。工具
在機器學習以前,人工智能(那時人們一般稱其爲專家系統)可能已經很「聰(wan)明(shan)」了,但其背後的工做原理是咱們已經明確地告訴它們一切必要的知識。專家系統就比如對照着一份龐大的列表清單來進行工做。咱們不能否認,使用這樣的清單是很是有效的決策方式,可是構建這樣一份完備的清單是很是耗時的。同時這類清單隻能狹隘地解決一個特定領域的問題:好比診斷某一類疾病或對某種型號的飛機進行安全檢查。學習
而在沒有指導的狀況下提取相關特徵的能力是機器學習革命性的核心。經過創建一組僅能由機器識別的特徵,機器學習系統就能用這些特徵對目標示例進行泛化。好比,經過一組貓的圖片與狗的圖片讓機器學習進行學習,提取貓與狗的不一樣特徵,從而構建出分類網絡。這個分類網絡就可以對測試圖片(未識別過的新圖片)進行相同的任務,分辨出圖片中的是狗仍是貓。就目前的發展來看,咱們徹底能夠將機器學習和人工智能劃上等號。雖然專家系統和相似的一些方法仍然有其存在的意義,但咱們已經不把它們稱爲人工智能了,就像前面提到的門檻已經變高了。測試
神經網絡(Neural networks)是目前實現機器學習比較有效的方法之一。雖然如今「神經網絡」的熱度很高,但機器學習並不是必定要使用神經網絡,使用其餘看似普通的架構也能達到不錯的效果。若是沒有一點相關的知識,想要解釋清楚到底什麼是神經網絡是有難度的,而我在這個系列以後的文章中會有涉及具體的細節。 歸納的說,神經網絡是由很是簡單的組件組成的複雜系統,它們將單個任務分解成多個子任務進行學習。某種程度上來講神經網絡是借鑑了真正的神經元的工做模式,但我認爲從長遠來看,人工智能系統遠達不到真正的人腦能力。就像飛機的翅膀模仿的是鳥類,但目前飛機的翅膀遠遠達不到鳥類翅膀的功能。阿里雲
深度學習(Deep learning)是指一類神經網絡。它有着特定的技術含義,但現在也成了這個領域的流行語。「深」,這裏指的是網絡架構具備多層結構。(三層咱們就稱爲「深」。而一層,咱們則稱之爲「淺」)。實際工做中,咱們發現深層網絡能夠比單層網絡能更有效地進行學習和推理。經過將虛擬神經元堆疊成層次結構,咱們能夠表現更多樣本的特徵。人工智能
自信地談論人工智能
這裏是一些關於人工智能的描述,它們能幫你在與朋友們閒聊人工智能時創建一點信心:
機器學習是一種人工智能,它的核心是經過大量的樣本學習來發現其中的某些模式。
人工智能系統既能夠是授以於魚(直接告訴答案),也能夠是授以於漁(解決問題的方法)。或二者兼而有之。
目前大量的機器學習系統是基於神經網絡的,他們利用數以百計的工做單元協同工做來解決問題。
深度學習系統是神經網絡結構的最新研究進展,經過深度學習,計算機能夠提取出複雜的特徵,這種能力有時會超過人類專家。
本文由北郵@愛可可-愛生活老師推薦,@阿里云云棲社區組織翻譯。
文章原標題《AI Literacy: The basics of machine learning simple answers to common questions about AI and machine learning (part 1 of a series)》
做者:Liza Daly 軟件工程師,擔任過Safari 公司的CTO。涉及的領域包括機器學習,數碼藝術和電子讀物出版等。
譯者:friday_012 審閱: