從綜藝節目《危險邊緣》(Jeopardy)的贏家和圍棋大師,再到不光彩的、與廣告有關的種族定性,咱們彷佛進入了一我的工智能發展飛速加快的時代。可是,要創造出這樣一個徹底有感知能力的人他的電子大腦可以利用公平的道德判斷來徹底參與複雜的認知任務,目前算法
從綜藝節目《危險邊緣》(Jeopardy)的贏家和圍棋大師,再到不光彩的、與廣告有關的種族定性,咱們彷佛進入了一我的工智能發展飛速加快的時代。可是,要創造出這樣一個徹底有感知能力的人他的電子「大腦」可以利用公平的道德判斷來徹底參與複雜的認知任務,目前咱們的能力還不能作到。編程
不幸的是,目前的事態發展讓人們廣泛擔憂人工智能將來可能會變成什麼。它在最近流行文化中的表現代表,咱們對這項技術的態度是多麼謹慎和悲觀。恐懼的問題在於,它可能會形成嚴重的後果,有時還會滋長無知。網絡
瞭解人工智能的內部運做是解決這些憂慮的一劑良藥。並且,這種認真能夠促成負責任的和使人放心的參與。機器學習
人工智能的核心基礎是機器學習,這是一種優雅而又普遍使用的工具。但要理解機器學習的意義,咱們首先須要研究它的潛力是如何絕對超過它的壞處的。工具
數據是關鍵學習
簡單地說,機器學習指的是教計算機如何經過算法來分析數據從而解決特定任務。例如,對於手寫識別,能夠經過分類算法,從而分辨出不一樣人所寫的字母。另外一方面,住房數據集利用迴歸算法,以可量化的方式來評估某一財產的售價。大數據
那麼,機器學習最終歸結爲數據。幾乎每個企業都會以這樣或那樣的方式產生數據: 請想一想市場研究、社交媒體、學校調查和自動化系統。機器學習應用程序試圖在大數據集的混亂中找出隱藏的模式和相關性,從而開發可以預測行爲的模型。人工智能
數據有兩個關鍵要素樣本和特徵。前者表示組中的單個元素;後者則表示它們所共有的特徵。spa
以社交媒體爲例:用戶是樣本,他們的使用能夠被翻譯爲特徵。例如,facebook將「贊」活動的不一樣方面(用戶之間不盡相同)做爲用於定向投放廣告的一個重要特徵。翻譯
Facebook好友也能夠做爲樣本使用,而他們與他人的聯繫也能夠做爲特徵,創建一個能夠研究信息傳播的網絡。
個人Facebook好友網絡:每一個節點都是一個可能會或可能不會與其餘朋友鏈接的朋友。節點越大,鏈接就越多。類似的顏色也表明着類似的社會圈子。
除了社交媒體以外,在工業過程當中做爲監控工具使用的自動化系統,將整個過程的時間快照做爲樣本,以特定時間做的傳感器測量爲特徵。這使得系統可以實時檢測出該過程當中的異常現象。
全部這些不一樣的解決方案都依賴於向機器提供數據,並教它們在有策略地評估給定信息的狀況下,實現本身的預測。這就是機器學習。
以人類智力做爲一個起點
任何數據均可以被翻譯成這些簡單的概念,任何機器學習應用,包括人工智能,都將這些概念做爲其構建基矗
一旦數據被理解,就該決定如何處理這些信息了。機器學習最廣泛、最直觀的應用之一就是分類。系統學習瞭如何根據參考數據集將數據放入不一樣的組中。
這與咱們天天作的各類決定有直接關係,不管是對相似產品進行分組(例如針對美容產品的廚房用品),仍是根據以往的經驗選擇好的電影。雖然這兩個例子可能看起來徹底脫節,但它們依賴於一個基本的分類假設:被定義爲已肯定類別的預測。
舉個例子,當咱們拿起一瓶潤膚乳時,咱們會使用特定的特徵列表(好比容器的形狀,或者產品的氣味)來準確地預測它是一種美容產品。一個相似的策略是經過評估一組特徵(好比導演,或者是演員)來預測電影是否屬於兩類其中之一:好仍是壞。
經過掌握與一組樣本相關的各類特徵之間的不一樣關係,咱們能夠預測一部電影是否值得觀看,或者,更好的狀況是,咱們能夠建立一個程序來爲咱們作這件事。
但要想掌握這些信息,咱們須要成爲一名數據科學專家,精通數學和統計學,有足夠的編程技能讓艾倫圖靈(Alan Turing )和瑪格麗特漢密爾頓(Margaret Hamilton)感到驕傲,對嗎?不徹底是。
在平常生活中,咱們都掌握了足夠多的母語,即便咱們中只有少數人能涉足語言學和文學。數學也同樣,它一直都在咱們身邊,因此從買東西或測量原料到遵循菜譜的變化並不是一種負擔。一樣地,掌握機器學習並非有意識和有效地對其進行利用的必要條件。
是的,世界上的確有很是優秀和專業的數據科學家,可是,任何人幾乎不花費任何努力均可以學習數據的基本知識,並改進他們觀察和利用信息的方式。
經過算法來解決問題
回到分類算法上,讓咱們考慮一個模仿咱們作決定的方式的算法。咱們是社會的人,那麼社會交往呢?第一印象很重要,咱們都有一種內部模式,在和別人見面的最初幾分鐘裏,評估本身是否喜歡對方。
有兩種可能的結果:好的或壞的印象。對每一個人來講,不一樣的特性(特徵)都被考慮在內(即便是無心識的),基於過去的幾回相遇(樣本)。多是語氣或外表,或者禮貌程度等。
對於咱們遇到的每個新面孔,咱們頭腦中的一個模型都會記錄這些輸入,並創建一個預測。咱們能夠把這個模型分解成一組輸入,根據它們對最終結果的相關性進行加權。
對一些人來講,吸引力多是很是重要的,而對於另外一些人來講,幽默感或愛狗則更能說明問題。每一個人都將開發本身的模型,這徹底取決於她的經驗或數據。
不一樣的數據致使不一樣的模型被訓練,結果不一樣。咱們的大腦會發展出一些機制(雖然咱們對此並不徹底清楚),但這些機制會肯定這些因素將如何影響咱們對因素的權重。
機器學習所作的是爲機器開發出精確和數學的方法,從而計算結果,特別是在咱們沒法輕易處理數據量的狀況下。如今超過了以往任什麼時候候,數據是巨大、永恆的。有了一個能夠積極使用這些數據來解決實際問題的工具,好比人工智能,這意味着每一個人都應該而且可以探索和利用這一點。咱們應該這樣作,這樣不只能夠創造出有用的應用,還能夠把機器學習和人工智能放在一個更光明、更不使人擔心的角度。
如今有不少資源供機器學習使用,但這些資源確實須要一些編程能力。許多適合機器學習的流行語言都提供從基礎教程到完整的課程。只需一個下午的時間,就能夠開始冒險,得到明顯的結果。
全部這一切並非說,具備人類思惟的機器的概念不該該讓咱們感到擔心。可是,更多地瞭解這些想法將如何發揮做用,將使咱們有能力成爲積極變革的推進者,從而使咱們可以保持對人工智能的控制,而不是反過來。
大量數據樣本 ,特徵,學習,建模