做者 | Jamie Beach
編譯 | AI開發者
本文的做者是 Jamie Beach,在自學人工智能 100 天之後,他分享了本身對人工智能的 5 個感悟,如下是他的全文。python
2019 年 1 月底,我忽然意識到,我對人工智能的理解不足。它正日益影響着咱們的每一天。人工智能保護咱們的收件箱免受垃圾郵件的攻擊,它支持來自 Alexa 的天氣更新,它使亞馬遜可以向咱們推薦商品,讓 Netflix 給咱們推薦電影。每次咱們打開 twitter 或 facebook,都是人類與比咱們更瞭解本身的人工智能的較量。但我是一個專業的技術人員,卻對人工智能的真正含義知之甚少。面試
《連線》雜誌創辦人 Kevin Kelly 在一個名爲「將來思考者(Future Thinkers)」的播客上接受採訪時,談到過 AI 相關的話題。他認爲,咱們的人工智能技術還處於起步階段,若是有人花一點時間學習人工智能和機器學習,超越只是瞭解的水平,他們會發現本身只是一小部分人中的一部分。那天下班回家後,我開始了爲期 100 天的「人工智能學習潛水」。算法
我將須要學習的全部東西都進行了分類(https://trello.com/b/g1cS5K0O/100-days-of-ai)。因爲在職,很難找到業餘時間,但我確實在 100 天內完成了近 200 個小時的工做。我讀了 9 本書,上了 2 門 Coursera 課程(已經開始學習第三門課),聽了不少播客,看了儘量多的輔助教程。小程序
如下是我在那段時間總結出的 5 個觀點:安全
01.人工智能是舊的也是新的網絡
人工智能這個詞並不是出自某部科幻小說。1956 年,在達特茅斯學院的一個暑期研討會上,許多聰明人彙集在一塊兒研究如何讓機器思考。在此次聚會中產生了「人工智能」這個概念。雖然此次會議並無研究出具備思惟的機器人,但它帶來的思想和技術仍然是當今人工智能的基礎。app
研討會以後,人們對人工智能的不一樣子領域的興趣加強。神經網絡彷佛頗有前途,但在當時這項技術一片空白,大多數研究最終放棄了這一律念。這個時期被稱爲「AI 寒冬」,它持續了幾十年。然而,近年來,算力和可用數據的指數增加,加上深度學習的最新進展,極大地提升了機器學習的有效性。AI 被 Andrew Ng 等專家稱爲「新的電力(new electricity)」。框架
02.人工智能等同於機器學習,但它不是終結者機器學習
「人工智能是用 powerpoint 完成的,機器學習是用 python 完成的(「AI is done in PowerPoint and machine learning in Python」)」學習
終結者,在流行文化中是超智能的縮影
人工通用智能(Artificial General Intelligence,簡稱 AGI)是一種假想的機器,它的思惟方式和人類同樣, 好比終結者就是這種機器人。超智能是超越人類思惟能力的機器(若是讀過 Nick Bostrom 的 Superintelligence,你可能會有點懼怕它),但在如今,尚未這樣的事物出現。到目前爲止,AGI 只是一種幻想,它在將來,而且有點高不可攀。這並不意味着沒人在作這件事,這也不意味着像 Max Tegmark 和 Ray Kurzweil 這樣的聰明人不會普遍地談論它並期待它。但目前人工智能的形式幾乎就是機器學習 —— 一個 AI 的子領域。
機器學習的基本原理以下:
第一步:把一個問題變成一個預測問題。換句話說,給定輸入參數(特徵),預測結果。你能夠預測一棟房子的價格,或者是拍攝時給定的攝像位置。
第二步:定義算法或者系統,作出決策。這裏有不少方法,如線性迴歸,神經網絡,深度學習,支持向量機,遞歸神經網絡,卷積神經網絡,生成性對抗網絡等等。每種算法均可以用於一種特殊的預測問題。要預測房屋成本,線性迴歸模型就足夠了;預測電影劇本將使用一個遞歸神經網絡(RNN);預測不存在的人的面部圖像使用生成性對抗網絡(GAN)。
第三步:獲取大量的訓練數據。一般狀況下,數據越多,效果越好。對於房價,要獲取數千行數據,其中包含這些房屋出售的特徵和實際價格(標籤)。對於字符識別,須要獲取大量的字符圖片並相應地進行標註。
第四步:訓練模型。提供訓練數據,計算偏差,調整並重復,直到偏差最小化。梯度降低和反向傳播是這裏的重要概念。
假設偏差已經達到最小,模型就能夠接受新的特徵,並預測結果。這個結果一般很是準確——比人類更精確。
03.沒有魔法,只有數學
我剛在谷歌上找到的公式
在開始這 100 天以前,我知道機器學習會涉及到數學,但我並不知道會須要多少數學知識。瞭解微積分和矩陣代數對任何人來講都是很是有益的,幸運的是,你不須要是數學專業的學生就能夠學會這些,並且機器學習的框架也在不斷地迭代,變得愈來愈易用。
一些重要的框架,包括 Google 的 Tensorflow、Microsoft 的 http://ML.NET 和 PyTorch 爲程序、數學和算法添加了抽象層。甚至還有額外的抽象層,好比於 Tensorflow 上面的 Keras。
此外,相關人員正經過提供機器學習模型做爲一項服務,或建立自動化的程序(如 AutoML 和 Auto-Keras),使機器學習更加容易上手。
04.誤差是個大問題
「真正的安全問題是,若是咱們給這些系統提供有誤差的數據,系統就會有誤差」——John Giannandrea。
機器學習中的誤差是個大問題。Amy Webb 的書「The Big Nine」中有好幾個章節都提到了這個問題。測試數據的全面性和多樣性是很是重要的,但這每每是缺少的。
1956 年以來的「人工智能的奠定人」
Amy 使用 ImageNet 語料庫做爲有固定誤差的例子,它裏面有超過 1400 萬張標記圖片,其中一半以上是在美國產生做的。固然,ImageNet 並非惟一一個有誤差的例子。
當一個數據集中包含了「護士」的女性形象或「首席執行官」的男性形象時會發生什麼?當皮膚癌圖像數據只使用淺膚色樣本時會發生什麼?若是這些模型真正進入咱們的平常生活時,就會產生嚴重的後果。隨着 ML 模型的全民化繼續進行,咱們每每在不知道用於訓練的測試數據是什麼樣的狀況下,就使用預先製做的模型,這種誤差持續存在,並可能放大。
研究人員很清楚這一問題,九大公司(G-MAFIA + BAT)都有和指導原則來講明減小工程文化誤差的必要性。但這不是故意的。沒有人會故意在模型中加入誤差,即便是出於善意,誤差也是不可避免的。
所以,咱們都必須瞭解機器學習的工做原理,以及它是如何影響咱們的——它是如何爲 Twitter 和 Facebook 提供能量的,這些能量會攪動咱們本身的神經元,從而影響咱們對世界的見解。
05.機會如此之多
全球人工智能衍生業務價值預測(單位:十億美圓),數據來源:Gartner(2018 年 4 月)
Kevin Kelly 是對的。咱們還處在人工智能和機器學習的早期。是的,有不少應用程序已經滲透到咱們的生活中,但仍然有不少不少的機會。
機器學習可以、已經和將會完全改變一切。在過去的 100 天裏,我讀過的許多書中有一本叫「Manna」,做者是 Marshall Brian。這是一本科幻小說,它描述了一個近乎烏托邦的社會,機器和自動化承擔了全部的工做,人類能夠爲所欲爲地生活。不須要 AGI,只須要機器學習。這樣的生活離咱們到底還有多遠?
我預見到將來 Instagram 名人和 YouTube 博主甚至都不是真實的,但卻擁有數以千萬計的追隨者,他們發佈的內容徹底由 GAN 和 RNN 生成。由機器學習驅動的新的娛樂模式將會誕生,從電影腳本到栩栩如生的超現實的三維模型都是由機器學習模型建立的。忘了面試工做吧。當你本身的我的數據記錄能夠與全部當前職位空缺的公司數據檔案相匹配時,又何須費心呢?從癌症治療到餐廳晚餐,再到實時生成的音樂,一切均可以使用 ML 個性化地產生。自動駕駛的出租車、基於 RNN 的文案服務、自動化服務協議、自動化法庭裁決、個性化生活改善策略、無人機交付、基於人工智能的投資,這些都是無止境的、有形的,並且幾乎都是目前的熱門領域。
人工智能和機器學習也可能在全文明水平上影響人類,幫助緩解存在的風險,如氣候變化、戰爭、疾病甚至小行星撞擊地球。
世界即將變得不一樣。咱們可能會注意到這一點,也可能不會。人工智能將推進這一變化,並且它已經開始在咱們身上蔓延。
正如 Kevin Kelly 所說,
將來發生得很慢,但會忽然爆發(the future happens slowly and then all at once)。
搜索進入小程序,解鎖更多優質內容和精彩資訊,不要錯過喲(嘿嘿~~~~)!