人工智能執行指南,從機器學習和通用人工智能到神經網絡。html
做者: 尼克希思 | 2020 年 12 月 11 日 -- 格林威治標準時間 09:58(新加坡標準時間 17:58) | 主題:[在企業中管理 AI 和 MLgit
這取決於你問誰。github
早在 1950 年代,該領域的先驅 明斯基和麥卡錫將人工智能描述爲由機器執行的任何任務,而這些任務之前被認爲須要人類智能。web
這顯然是一個至關寬泛的定義,這就是爲何你有時會看到關於某物是不是真正的 AI 的爭論。算法
創造智能意味着什麼的現代定義更加具體。谷歌人工智能研究員、機器學習軟件庫 Keras 的建立者弗朗索瓦喬萊表示,智能與系統在新環境中適應和即興發揮的能力、歸納其知識並將其應用於不熟悉的場景的能力有關。數據庫
「智能是你在之前沒有準備的任務中得到新技能的效率,」他說。編程
「智力不是技能自己,也不是你能作什麼,而是你學習新事物的能力和效率。」swift
在這個定義下,現代人工智能驅動的系統,如虛擬助手,將被描述爲展現了「狹義人工智能」;在執行一組有限的任務時歸納訓練的能力,例如語音識別或計算機視覺。windows
一般,人工智能系統至少表現出如下與人類智能相關的一些行爲:計劃、學習、推理、解決問題、知識表示、感知、運動和操縱,以及在較小程度上的社交智能和創造力。網絡
AI 在今天無處不在,用於推薦您接下來應該在線購買什麼,瞭解您對虛擬助手(例如亞馬遜的 Alexa 和 Apple 的 Siri)說的話,識別照片中的人物和內容,發現垃圾郵件或檢測信用卡欺詐。
在很是高的層面上,人工智能能夠分爲兩大類:狹義人工智能和通用人工智能。
如上所述,狹義 AI 是咱們今天在計算機中看到的一切:智能系統已經被教導或學會了如何執行特定任務,而無需明確編程如何去作。
這種類型的機器智能在 Apple iPhone 上的 Siri 虛擬助手的語音和語言識別、自動駕駛汽車的視覺識別系統或根據您的喜愛推薦您可能喜歡的產品的推薦引擎中很明顯。過去買的。與人類不一樣,這些系統只能學習或被教導如何完成定義的任務,這就是爲何它們被稱爲狹義人工智能。
狹義人工智能有大量新興應用:解釋來自無人機的視頻源,對石油管道等基礎設施進行目視檢查,組織我的和企業日曆,響應簡單的客戶服務查詢,與其餘智能系統協調以執行在合適的時間和地點預訂酒店、幫助放射科醫生髮現X 射線中的潛在腫瘤、在線標記不當內容、根據物聯網設備收集的數據檢測電梯的磨損、從衛星生成世界的 3D 模型等任務圖像,這個列表不勝枚舉。
這些學習系統的新應用一直在涌現。顯卡設計師Nvidia 最近公佈了一個基於人工智能的系統 Maxine,它可讓人們進行高質量的視頻通話,幾乎無論他們的互聯網鏈接速度如何。該系統經過不經過互聯網傳輸完整的視頻流,而是以一種旨在重現呼叫者面部表情和動做的方式爲呼叫者的少許靜態圖像製做動畫,從而將此類呼叫所需的帶寬減小了 10 倍。實時且與視頻沒法區分。
然而,儘管這些系統具備未開發的潛力,但有時對該技術的雄心壯志超過了現實。一個典型的例子是自動駕駛汽車,它自己由計算機視覺等人工智能驅動的系統提供支持。電動汽車公司特斯拉落後於首席執行官埃隆·馬斯克 (Elon Musk) 將汽車自動駕駛系統從系統更有限的輔助駕駛功能升級爲「全自動駕駛」的原始時間表,而全自動駕駛選項最近才推出做爲 Beta 測試計劃一部分的精選專家驅動程序組。
通用人工智能很是不一樣,它是人類中發現的適應性智力類型,是一種靈活的智力形式,可以學習如何執行大相徑庭的任務,從理髮到構建電子表格,或基於推理對各類主題進行推理其積累的經驗。這是在電影中更常見的那種人工智能,好比 2001 年的 HAL 或終結者中的天網,但今天並不存在——人工智能專家們對於它多久會成爲現實存在激烈的分歧。
人工智能研究人員文森特·C·穆勒 (Vincent C Müller) 和哲學家尼克·博斯特羅姆 (Nick Bostrom) 在 2012/13 年對四組專家進行的一項調查報告稱,在 2040 年至 2050 年之間開發通用人工智能 (AGI) 的可能性爲 50%,到 2075 年上升到 90%。小組更進一步,預測所謂的「超級智能」——博斯特羅姆將其定義爲「在幾乎全部感興趣的領域都大大超過人類認知能力的任何智力」——預計在 AGI 實現大約 30 年後出現。
然而,人工智能專家最近的評估更加謹慎。現代人工智能研究領域的先驅,如 Geoffrey Hinton、Demis Hassabis 和 Yann LeCun 表示,社會離發展 AGI 還很遠。鑑於現代人工智能領域領先者的懷疑以及現代狹義人工智能系統與 AGI 的大相徑庭的性質,擔憂社會將在不久的未來被通用人工智能擾亂可能沒有什麼根據。
也就是說,一些人工智能專家認爲,鑑於咱們對人類大腦的瞭解有限,這種預測是很是樂觀的,而且認爲 AGI 還有幾個世紀的路程。
AI 多是一個熱門話題,但您仍然須要證實這些項目的合理性。
雖然現代狹義人工智能可能僅限於執行特定任務,但在其專業範圍內,這些系統有時可以表現出超人的表現,在某些狀況下甚至表現出卓越的創造力,這種特質一般被認爲是人類的本能。
已經有太多的突破沒法列出一個明確的清單,但一些亮點包括:2009 年,谷歌代表其自動駕駛豐田普銳斯有可能完成 10 屢次 100 英里的旅程,使社會走上無人駕駛的道路車輛。
IBM Watson 與 Jeopardy 競爭!2011年1月14日圖片:IBM
2011 年,IBM Watson計算機系統贏得美國智力競賽節目 Jeopardy!,擊敗了該節目有史以來最好的兩名球員。爲了贏得這場演出,Watson 使用天然語言處理和分析對大量數據存儲庫進行了處理,以回答人工提出的問題,一般在幾分之一秒內完成。
2012 年,另外一項突破預示着 AI 有潛力處理許多之前認爲對任何機器來講都過於複雜的新任務。那一年,AlexNet 系統在 ImageNet 大規模視覺識別挑戰賽中果斷獲勝。AlexNet 的準確性如此之高,與圖像識別競賽中的競爭對手系統相比,它的錯誤率減小了一半。
AlexNet 的性能證實了基於神經網絡的學習系統的強大功能,這種機器學習模型已經存在了幾十年,但因爲架構的改進和摩爾定律使並行處理能力的飛躍成爲可能,它最終實現了其潛力。機器學習系統在執行計算機視覺方面的實力也在當年成爲頭條新聞,谷歌訓練了一個系統來識別互聯網上的最愛:貓的照片。
引發公衆注意的機器學習系統功效的下一個展現是2016 年穀歌 DeepMind AlphaGo AI 打敗人類圍棋大師,圍棋是一種古老的中國遊戲,其複雜性困擾了計算機數十年。圍棋每回合大約有 200 步,而國際象棋大約有 20 步。在圍棋過程當中,有不少可能的走法,從計算的角度來看,提早搜索每一個走法以肯定最佳棋法成本過高。取而代之的是,AlphaGo 經過將人類專家在 3000 萬場圍棋遊戲中的動做輸入深度學習神經網絡來訓練如何下棋。
訓練這些深度學習網絡可能須要很長時間,隨着系統逐漸完善其模型以實現最佳結果,須要攝取和迭代大量數據。
然而,最近谷歌使用 AlphaGo Zero 改進了訓練過程,該系統與本身玩「徹底隨機」的遊戲,而後從結果中學習。谷歌 DeepMind 首席執行官德米斯·哈薩比斯 (Demis Hassabis) 還推出了新版本的 AlphaGo Zero,它掌握了國際象棋和將棋遊戲。
AI 繼續衝刺突破新的里程碑: OpenAI 訓練的系統在在線多人遊戲 Dota 2 的一對一比賽中擊敗了世界頂級玩家。
同年,OpenAI 建立了 AI 代理,該代理髮明瞭 本身的語言來更有效地合做並實現目標,隨後 Facebook 培訓代理進行談判甚至撒謊。
2020 年是人工智能系統彷佛得到了像人類同樣寫做和談話的能力的一年,幾乎能夠討論任何你能想到的話題。
有問題的系統,被稱爲 Generative Pre-trained Transformer 3 或簡稱 GPT-3,是一個神經網絡,它訓練了開放網絡上數十億篇英語文章。
在非營利組織 OpenAI 將其提供給測試使用後不久,互聯網上就充斥着 GPT-3 可以生成幾乎任何主題的文章的能力,這些文章乍一看每每難以理解。區別於人寫的。在其餘領域也取得了一樣使人印象深入的結果,它可以使人信服地回答有關普遍主題的問題,甚至能夠經過 JavaScript 新手。
可是,儘管許多 GPT-3 生成的文章都具備真實性,但進一步的測試發現生成的句子一般沒有經過審覈,提供表面上看似合理但使人困惑的陳述,有時甚至是徹頭徹尾的胡說八道。
使用模型的天然語言理解做爲將來服務的基礎仍然有至關大的興趣,而且能夠選擇開發人員經過 OpenAI 的 beta API 構建到軟件中。它還將被歸入將來經過微軟 Azure 雲平臺提供的服務中。
人工智能潛力最顯着的例子可能出如今 2020 年底,當時基於谷歌注意力的神經網絡 AlphaFold 2 展現了一些人認爲值得得到諾貝爾化學獎的結果。
該系統可以查看蛋白質的組成部分(稱爲氨基酸)並推導出該蛋白質的 3D 結構,這可能會對了解疾病和開發藥物的速度產生深遠的影響。在蛋白質結構預測的關鍵評估競賽中,AlphaFold 2 可以肯定蛋白質的 3D 結構,其準確度可與晶體學相媲美,這是使人信服地建模蛋白質的黃金標準。
與須要數月才能返回結果的晶體學不一樣,AlphaFold 2 能夠在數小時內模擬蛋白質。因爲蛋白質的 3D 結構在人類生物學和疾病中發揮着如此重要的做用,這種加速被認爲是醫學科學的里程碑式突破,更不用說在生物技術中使用酶的其餘領域的潛在應用了。
迄今爲止提到的幾乎全部成就都源於機器學習,這是人工智能的一個子集,佔該領域近年來的絕大多數成就。當人們今天談論人工智能時,他們一般談論的是機器學習。
目前正在復興,簡單來講機器學習是計算機系統學習如何執行任務,而不是被編程如何執行。這種對機器學習的描述能夠追溯到 1959 年,當時它是由該領域的先驅 Arthur Samuel 創造的,他開發了世界上第一個自學系統之一,即 Samuel Checkers-playing Program。
爲了學習,這些系統須要輸入大量數據,而後它們會使用這些數據來學習如何執行特定任務,例如理解語音或爲照片添加字幕。該數據集的質量和大小對於構建可以準確執行其指定任務的系統很重要。例如,若是您正在構建一個機器學習系統來預測房價,則訓練數據應不只包括房產大小,還應包括其餘重要因素,例如臥室數量或花園大小。
機器學習成功的關鍵是神經網絡。這些數學模型可以調整內部參數以改變它們的輸出。在訓練期間,神經網絡會收到數據集,這些數據集會教它在呈現某些數據時應該吐出什麼。具體來講,網絡可能會收到 0 到 9 之間數字的灰度圖像,以及一串二進制數字——0 和 1——指示每一個灰度圖像中顯示的數字。而後對網絡進行訓練,調整其內部參數,直到它以高精度對每一個圖像中顯示的數字進行分類。而後,這個通過訓練的神經網絡可用於對 0 到 9 之間數字的其餘灰度圖像進行分類。
神經網絡的結構和功能很是鬆散地基於大腦中神經元之間的鏈接。神經網絡由相互鏈接的算法層組成,這些算法層相互饋送數據,而且能夠經過修改數據在這些層之間傳遞時的重要性來對其進行訓練以執行特定任務。在這些神經網絡的訓練過程當中,當數據在層之間傳遞時附加到數據上的權重將繼續變化,直到神經網絡的輸出很是接近所需的值,此時網絡將「學習」如何攜帶出一個特定的任務。所需的輸出能夠是任何東西,從正確標記圖像中的水果到根據傳感器數據預測電梯什麼時候可能發生故障。
機器學習的一個子集是深度學習,其中神經網絡被擴展爲具備大量使用大量數據訓練的至關大的層的龐大網絡。正是這些深度神經網絡推進了當前計算機執行語音識別和計算機視覺等任務的能力的飛躍。
有各類類型的神經網絡,具備不一樣的優勢和缺點。循環神經網絡 (RNN) 是一種特別適用於天然語言處理 (NLP)(理解文本的含義)和語音識別的神經網絡,而卷積神經網絡的根源在於圖像識別,其用途多種多樣推薦系統和 NLP。神經網絡的設計也在不斷髮展,研究人員改進了一種更有效的深度神經網絡形式,稱爲長期短時間記憶或 LSTM——一種用於 NLP 等任務和股票市場預測的 RNN 架構——使其可以運行足夠快,能夠在谷歌翻譯等按需系統中使用。
深度神經網絡的結構和訓練。圖片:細微差異
AI 研究的另外一個領域是進化計算,它借鑑了達爾文的天然選擇理論,並看到遺傳算法在世代之間經歷隨機突變和組合,以試圖進化出給定問題的最佳解決方案。
這種方法甚至被用於幫助設計 AI 模型,有效地使用 AI 來幫助構建 AI。這種使用進化算法來優化神經網絡的方法被稱爲神經進化,隨着智能系統的使用變得愈來愈廣泛,尤爲是在對數據科學家的需求每每超過供應的狀況下,它可能在幫助設計高效人工智能方面發揮重要做用。Uber AI Labs展現了這項技術,該實驗室發佈了關於使用遺傳算法訓練深度神經網絡以解決強化學習問題的論文。
最後,還有專家系統,其中計算機被編程規則,容許它們根據大量輸入作出一系列決策,從而容許該機器在特定領域模仿人類專家的行爲。例如,這些基於知識的系統的一個例子多是駕駛飛機的自動駕駛系統。
如上所述,近年來人工智能研究的最大突破是在機器學習領域,尤爲是在深度學習領域。
這在必定程度上是因爲數據易於得到,但更重要的是並行計算能力的爆炸式增加,在此期間,使用圖形處理單元 (GPU) 集羣來訓練機器學習系統變得更加廣泛。
這些集羣不只爲訓練機器學習模型提供了更強大的系統,並且它們如今做爲雲服務在互聯網上普遍可用。隨着時間的推移,谷歌、微軟和特斯拉等主要科技公司已經轉向使用專門爲運行和最近訓練機器學習模型量身定製的芯片。
這些定製芯片之一的一個例子是谷歌的張量處理單元 (TPU),其最新版本加快了使用谷歌 TensorFlow 軟件庫構建的有用機器學習模型從數據中推斷信息的速度,以及他們能夠接受培訓。
這些芯片不只用於訓練 DeepMind 和 Google Brain 的模型,還用於支持 Google Translate 和 Google Photos 中的圖像識別的模型,以及容許公衆使用Google 的 TensorFlow Research構建機器學習模型的服務雲。第三代芯片於 2018 年 5 月在谷歌的 I/O 大會上亮相,此後被打包成機器學習引擎,稱爲 pods,每秒可執行超過十萬萬億次浮點運算(100 petaflops) . 這些正在進行的 TPU 升級使谷歌可以改進其創建在機器學習模型之上的服務,例如將訓練谷歌翻譯中使用的模型所需的時間減半。
如前所述,機器學習是人工智能的一個子集,一般分爲兩大類:監督學習和無監督學習。
監督學習
教授 AI 系統的經常使用技術是使用大量標記示例對其進行訓練。這些機器學習系統接受了大量數據,這些數據已通過註釋以突出顯示感興趣的特徵。這些多是貼有標籤的照片,以代表它們是否包含狗或帶有腳註的書面句子,以代表「低音」一詞與音樂或魚有關。一旦通過訓練,系統就能夠將這些標籤應用於新數據,例如應用於剛剛上傳的照片中的狗。
這種經過示例教授機器的過程稱爲監督學習,標記這些示例的角色一般由在線工做人員執行,經過 Amazon Mechanical Turk 等平臺僱用。
訓練這些系統一般須要大量數據,有些系統須要搜索數百萬個樣本才能學習如何有效地執行任務——儘管在大數據和普遍的數據挖掘時代,這愈來愈有可能。訓練數據集龐大且規模不斷擴大 ——Google 的 Open Images Dataset 擁有大約 900 萬張圖像,而其標記視頻存儲庫 YouTube-8M連接到 700 萬個標記視頻。 ImageNet是此類早期數據庫之一,擁有超過 1400 萬張分類圖像。通過兩年多的編譯,它由近 50,000 人(其中大部分是經過 Amazon Mechanical Turk 招募的)組裝在一塊兒,他們檢查、分類和標記了近 10 億張候選圖片。
從長遠來看,訪問大量標記數據集也可能不如訪問大量計算能力重要。
近年來,生成對抗網絡 ( GAN ) 已被用於機器學習系統中,該系統只須要少許標記數據和大量未標記數據,顧名思義,這須要較少的人工準備工做。
這種方法能夠容許更多地使用半監督學習,與當今使用監督學習的訓練系統相比,系統可使用更少的標記數據來學習如何執行任務。
無監督學習
相比之下,無監督學習使用不一樣的方法,其中算法嘗試識別數據中的模式,尋找可用於對數據進行分類的類似性。
一個例子多是將重量類似的水果或具備類似發動機尺寸的汽車彙集在一塊兒。
該算法不是預先設置來挑選特定類型的數據,它只是尋找能夠按其類似性分組的數據,例如 Google 新聞天天將相似主題的故事分組在一塊兒。
強化學習
強化學習的一個粗略類比是在寵物表演技巧時獎勵它。在強化學習中,系統試圖根據其輸入數據最大化獎勵,基本上會經歷一個反覆試驗的過程,直到達到可能的最佳結果。
強化學習的一個例子是 Google DeepMind 的 Deep Q-network,它已被用於在各類經典視頻遊戲中實現最佳人類表現。該系統從每一個遊戲中獲取像素並肯定各類信息,例如屏幕上對象之間的距離。
經過查看每場比賽的得分,系統創建了一個模型,說明在不一樣狀況下哪些動做將使得分最大化,例如,在視頻遊戲 Breakout 的狀況下,應該將球拍移到那裏以攔截球。
該方法還用於機器人研究,其中強化學習能夠幫助教授自主機器人在現實世界環境中的最佳行爲方式。
許多與 AI 相關的技術正在接近或已經達到 Gartner 炒做週期中的「指望太高的峯值」,而由強烈反對驅動的「幻滅低谷」正在等待中。圖片:Gartner / 註釋:ZDNet
Google 的 DeepMind 和 NHS:一瞥人工智能對將來醫療保健的意義
谷歌子公司與英國醫療服務機構達成了一系列交易——那麼到底發生了什麼?
隨着人工智能在現代軟件和服務中發揮愈來愈重要的做用,各大科技公司都在努力開發強大的機器學習技術供內部使用,並經過雲服務向公衆銷售。
每一個人都常常成爲人工智能研究新領域的頭條新聞,儘管谷歌的 DeepMind 人工智能 AlphaFold 和 AlphaGo 系統可能對公衆的人工智能意識產生了最大的影響。
全部主要的雲平臺——亞馬遜網絡服務、微軟 Azure 和谷歌雲平臺——都提供了對 GPU 陣列的訪問,用於訓練和運行機器學習模型,谷歌還準備讓用戶使用其張量處理單元 ——其設計的定製芯片針對訓練和運行機器學習模型進行了優化。
全部必要的相關基礎設施和服務均可以從三大巨頭中得到,基於雲的數據存儲,可以保存訓練機器學習模型所需的大量數據,轉換數據以準備分析的服務,可視化工具清晰地顯示結果,以及簡化模型構建的軟件。
這些雲平臺甚至簡化了自定義機器學習模型的建立,谷歌提供了一項服務,能夠自動建立 AI 模型,稱爲 Cloud AutoML。這種拖放式服務可構建自定義圖像識別模型,而且要求用戶沒有機器學習專業知識。
基於雲的機器學習服務在不斷髮展。亞馬遜如今提供了一系列旨在簡化機器學習模型訓練過程的 AWS 產品,而且最近推出了 Amazon SageMaker Clarify,這是一種幫助組織消除訓練數據中可能致使訓練模型出現誤差預測的偏見和不平衡的工具.
對於那些不想構建本身的機器學習模型,而是想使用 AI 驅動的按需服務(例如語音、視覺和語言識別)的公司,Microsoft Azure 在如下方面的服務範圍內脫穎而出提供,緊隨其後的是 Google Cloud Platform,而後是 AWS。與此同時,IBM 與其更通用的按需產品一塊兒,還試圖銷售針對從醫療保健到零售的各個領域的特定行業人工智能服務,將這些產品組合在IBM Watson 保護傘下,並已投資 20 億美圓收購 The Weather Channel解鎖大量數據以加強其人工智能服務。
在內部,每一家科技巨頭——以及 Facebook 等其餘巨頭——都使用人工智能來幫助推進無數的公共服務:提供搜索結果、提供推薦、識別照片中的人和事物、按需翻譯、發現垃圾郵件——名單很是普遍。
但這場人工智能戰爭最明顯的表現之一是虛擬助手的興起,例如蘋果的 Siri、亞馬遜的 Alexa、谷歌助手和微軟的 Cortana。
Amazon Echo Plus 是一款智能揚聲器,能夠訪問內置的亞馬遜 Alexa 虛擬助手。圖片:Jason Cipriani/ZDNet
嚴重依賴語音識別和天然語言處理,以及須要龐大的語料庫來回答查詢,大量的技術用於開發這些助手。
可是,雖然蘋果的 Siri 可能首先脫穎而出,但谷歌和亞馬遜的助手已經在人工智能領域超越了蘋果——谷歌助手可以回答普遍的查詢,亞馬遜的 Alexa 擁有大量「技能」第三方開發人員建立以增長其功能。
隨着時間的推移,這些助理正在得到能力,使他們的反應更快,可以更好地處理人們在常規對話中提出的問題類型。例如,谷歌助手如今提供了一項名爲「持續對話」的功能,用戶能夠在其中詢問他們最初查詢的後續問題,例如「今每天氣怎麼樣?」,而後是「明天怎麼樣?」 而且系統理解後續問題也與天氣有關。
這些助手和相關服務還能夠處理的不只僅是語音,最新版本的 Google Lens 可以翻譯圖像中的文本,並容許您使用照片搜索衣服或傢俱。
儘管內置於 Windows 10 中,但 Cortana 最近經歷了一段特別艱難的時期,亞馬遜的 Alexa 如今能夠在 Windows 10 PC 上無償使用,而微軟則 改造了 Cortana 在操做系統中的角色, 以更多地關注生產力任務,例如管理用戶的日程安排,而不是其餘助手中更多以消費者爲中心的功能,例如播放音樂。
認爲美國科技巨頭將人工智能領域縫合起來是一個很大的錯誤。中國公司阿里巴巴、百度和聯想正在從電子商務到自動駕駛等領域大力投資人工智能。做爲一個國家,中國正在推行三步走計劃,將人工智能轉變爲國家的核心產業,到2020 年末,該產業的 價值將達到 1500 億元人民幣(220 億美圓), 目標是成爲世界領先的人工智能強國。到 2030 年。
百度已投資開發自動駕駛汽車,由其深度學習算法百度 AutoBrain 提供支持,通過幾年的測試,其 Apollo 自動駕駛汽車已 在測試中行駛超過 300 萬英里,並搭載在全球 27 個城市運送超過 100,000 名乘客。
百度今年在北京推出了一支由 40 輛 Apollo Go Robotaxis 組成的車隊,該公司創始人預測,自動駕駛汽車將在五年內在中國城市普及。
百度的自動駕駛汽車,改裝的寶馬3系。圖片:百度
百度、阿里巴巴和騰訊等大公司薄弱的隱私法、鉅額投資、協同數據收集和大數據分析的結合,意味着一些分析人士認爲,在將來的人工智能研究方面,中國將比美國更具優點一位分析師將中國領先美國的可能性描述爲 500 比 1 對中國有利。
雖然你能夠爲你的 PC 購買一箇中等強大的 Nvidia GPU——在 Nvidia GeForce RTX 2060 或更快的某個地方——並開始訓練機器學習模型,但最簡單的人工智能相關服務試驗方法多是經過雲。
全部主要的科技公司都提供各類 AI 服務,從構建和訓練您本身的機器學習模型的基礎設施到容許您按需訪問 AI 驅動的工具(例如語音、語言、視覺和情感識別)的網絡服務.
機器人和無人駕駛汽車
機器人可以自主行動並理解和導航周圍世界的願望意味着機器人和人工智能之間存在天然重疊。雖然人工智能只是機器人技術中使用的技術之一,但人工智能的使用正在幫助機器人進入新領域,如自動駕駛汽車、送貨機器人,以及幫助機器人學習新技能。2020 年初,通用汽車和本田推出了電動無人駕駛汽車Cruise Origin,谷歌母公司 Alphabet 旗下的自動駕駛集團 Waymo 最近在亞利桑那州鳳凰城向公衆開放了機器人出租車服務,提供了服務覆蓋城市50平方英里的區域。
假新聞
咱們即將擁有能夠建立逼真圖像或以完美音調複製某人聲音的神經網絡。隨之而來的是具備巨大破壞性的社會變革的潛力,例如再也不可以相信視頻或音頻片斷是真實的。人們也開始擔憂這些技術將如何被用來盜用人們的形象,已經建立了一些工具來 使人信服地將名人面孔拼接到XX電影中。
語音和語言識別
機器學習系統幫助計算機識別人們在說什麼,準確率接近 95%。微軟的人工智能和研究小組還報告說,它已經開發出一種系統,可以像人工轉錄員同樣準確地轉錄口語英語。
隨着研究人員追求 99% 準確率的目標,預計與計算機對話與更傳統的人機交互形式一塊兒變得愈來愈廣泛。
與此同時,OpenAI 的語言預測模型 GPT-3 最近引發了轟動,由於它可以建立能夠被視爲由人類編寫的文章。
人臉識別和監控
近年來,人臉識別系統的準確率有了飛躍,中國科技巨頭百度表示,只要視頻中的人臉足夠清晰,它就能以 99% 的準確率匹配人臉。雖然西方國家的警察部隊通常只在大型活動中試用面部識別系統,但在中國,當局正在開展一項全國性計劃,將全國的閉路電視與面部識別系統鏈接起來,並使用人工智能系統跟蹤嫌疑人和可疑行爲,以及已經還擴大警察使用的面部識別眼鏡。
儘管世界各地的隱私法規各不相同,但這種對人工智能技術(包括能夠識別情緒的人工智能)的更具侵入性的使用可能會逐漸變得更加廣泛,儘管對面部識別系統公平性的強烈反對和質疑已經致使亞馬遜, IBM 和 Microsoft 暫停或中止向執法部門出售這些系統。
衛生保健
人工智能最終可能對醫療保健產生巨大影響,幫助放射科醫生從 X 射線中挑選出腫瘤,幫助研究人員發現與疾病相關的基因序列並識別可能致使更有效藥物的分子。谷歌的 AlphaFold 2 機器學習系統最近取得的突破有望將開發新葯的關鍵步驟所需的時間從幾個月縮短到幾小時。
世界各地的醫院都在試驗人工智能相關技術。其中包括 IBM 的 Watson 臨牀決策支持工具,該工具由記念斯隆凱特琳癌症中心的腫瘤學家進行培訓,以及英國國家衛生服務中心對 Google DeepMind 系統的使用,它將幫助發現眼睛異常並簡化篩查患者的過程頭頸癌。
強化歧視和偏見
一個日益使人擔心的問題是機器學習系統如何將其訓練數據中反映的人類偏見和社會不平等編入法典。多個例子證明了這些擔心,這些例子代表,用於訓練此類系統的數據缺少多樣性會對現實世界產生負面影響。
2018 年,麻省理工學院和微軟的一份研究論文發現,主要科技公司銷售的面部識別系統在識別膚色較深的人時出現錯誤率明顯更高的問題,這一問題歸因於訓練數據集主要由白人組成。
一年後的另外一項研究強調,亞馬遜的 Rekognition 面部識別系統在識別膚色較深個體的性別時存在問題,亞馬遜高管對這一指控提出質疑,促使其中一名研究人員解決亞馬遜反駁中提出的觀點。
自從這些研究發表以來,許多大型科技公司至少暫時中止了向警察部門銷售面部識別系統。
另外一個訓練數據誤差不足的例子在 2018 年成爲頭條新聞,當時亞馬遜取消了一種機器學習招聘工具,該工具將男性申請人視爲首選。今天,正在研究如何抵消自學系統中的偏見。
人工智能與全球變暖
隨着機器學習模型的規模和用於訓練它們的數據集的增加,塑造和運行這些模型的龐大計算集羣的碳足跡也在增長。爲這些計算農場供電和冷卻對環境的影響是世界經濟論壇 2018 年一篇論文的主題。2019 年的一項估計是,機器學習系統所需的功率每 3.4 個月翻一番。
最近,語言預測模型 GPT-3 的發佈使訓練強大的機器學習模型所需的大量能量成爲焦點,這是一個擁有約 1750 億個參數的龐大神經網絡。
雖然訓練這些模型所需的資源多是巨大的,並且主要只有大公司才能使用,但一旦訓練好,運行這些模型所需的能量就會大大減小。然而,隨着基於這些模型的服務需求的增加,功耗和由此產生的環境影響再次成爲一個問題。
一種論點是,須要權衡訓練和運行更大模型對環境的影響與潛在的機器學習必須產生重大的積極影響,例如,在谷歌 DeepMind 的 AlphaFold 2 取得突破以後,醫療保健領域的進步可能會更快.
一樣,這取決於你問誰。隨着人工智能驅動的系統變得愈來愈強大,對不利因素的警告也變得更加可怕。
特斯拉和 SpaceX首席執行官埃隆馬斯克聲稱人工智能是「人類文明存在的根本風險」。做爲他推進增強監管和更負責任的研究以減輕人工智能負面影響的一部分,他成立了 OpenAI,這是一家非營利性人工智能研究公司,旨在促進和開發有益於整個社會的友好人工智能。一樣,受人尊敬的物理學家斯蒂芬霍金警告說,一旦創造出足夠先進的人工智能,它將迅速發展到遠遠超過人類能力的程度,這種現象被稱爲奇點,並可能對人類構成生存威脅。
然而,對於一些人工智能研究人員來講,人類正處於人工智能爆炸的邊緣,這將使咱們的智力相形見絀的想法彷佛很荒謬。
微軟在英國劍橋的研究主管克里斯畢曉普強調,今天人工智能的狹隘智能與人類的通常智能有多麼不一樣,他說,當人們擔憂「終結者和機器的崛起等等?胡說八道,是的。充其量,這種討論還須要幾十年的時間。」
人工智能系統取代大部分現代體力勞動的可能性在不久的未來多是一種更可信的可能性。
ZDNet 和 TechRepublic 着眼於人工智能、大數據、雲計算和自動化對 IT 工做的巨大影響,以及公司如何適應。
雖然人工智能不會取代全部工做,但彷佛能夠確定的是,人工智能將改變工做的性質,惟一的問題是自動化將改變工做場所的速度和深度。
幾乎沒有人工智能沒法影響人類努力的領域。正如人工智能專家 Andrew Ng 所說:「不少人都在作着例行的、重複性的工做。不幸的是,技術尤爲擅長自動化例行性、重複性的工做」,並表示他認爲「將來幾十年技術失業的風險很大」。
哪些工做將被取代的證據開始出現。在美國,如今有 27 家Amazon Go商店,這些沒有收銀員的超市,顧客只需從貨架上拿走商品就能夠走出去。這對美國超過三百萬的收銀員意味着什麼還有待觀察。亞馬遜再次在使用機器人提升倉庫效率方面處於領先地位。這些機器人將貨架上的產品運送給選擇要發送的物品的人工揀貨員。亞馬遜在其履行中心擁有超過 200,000 個機器人,並計劃增長更多。但亞馬遜也強調,隨着機器人數量的增長,這些倉庫中的人工數量也在增長。然而,亞馬遜和小型機器人公司正在努力使倉庫中剩餘的手工做業自動化,所以手工和機器人勞動力將繼續攜手並進並非必然的。
亞馬遜於 2012 年收購了 Kiva 機器人,現在在其整個倉庫中使用 Kiva 機器人。圖片:亞馬遜
徹底自主的自動駕駛汽車還沒有成爲現實,但根據一些預測,即便不考慮對快遞員和出租車司機的影響,僅自動駕駛卡車運輸行業就有望在將來十年內取代 170 萬個工做崗位。
然而,一些最容易自動化的工做甚至不須要機器人技術。目前有數百萬人從事管理工做,在系統之間輸入和複製數據,爲公司尋找和預定約會。隨着軟件在自動更新系統和標記重要信息方面變得更好,所以對管理員的需求將會降低。
與每一次技術變革同樣,將創造新的工做崗位來取代失去的工做崗位。然而, 不肯定的是這些新角色是否會以足夠快的速度被創造出來,爲那些流離失所的人提供就業機會,以及新失業者是否具有必要的技能或氣質來填補這些新角色。
計算機視覺、語音、分析和移動機器人技術的進步有望影響與這些技能相關的任何工做。
不是每一個人都是悲觀主義者。對某些人來講, 人工智能是一種將增長而不是取代工人的技術。不只如此,他們還認爲,做爲 AI 輔助的工做人員,商業上必須不徹底取代人們——想一想一個配備 AR 耳機的人類禮賓員,在他們提出要求以前就告訴他們客戶想要什麼——將會更多比獨立工做的人工智能更有生產力或更有效。
在人工智能專家中,對於人工智能系統超越人類能力的速度有多快,存在普遍的意見。
牛津大學人類將來研究所請數百名機器學習專家預測 將來幾十年的人工智能能力。
值得注意的日期包括人工智能撰寫論文到 2026 年可能由人類撰寫,到 2027 年卡車司機被裁人,到 2031 年人工智能在零售業超越人類能力,到 2049 年寫出暢銷書,到 2053 年完成外科醫生的工做.
他們估計人工智能在 45 年內在全部任務上擊敗人類並在 120 年內自動化全部人類工做的可能性相對較高。