近來人工智能這個話題非常熱門,也來湊湊熱鬧.
人工智能,大數據分析,在不少人看來是高科技,高深莫測,望而生畏.
其實人工智能的核心思想也很簡單,普通人也能看得懂.面試
這是一篇人工智能的科普文章,試圖讓你們都能看得懂,只需識字便可.
爲了有趣,先來兩個譁衆取寵的論述:算法
相信不少人看了這兩個論述,都會發笑, 其實我是很認真的.學習
簡單的說,就是經過對過去已知數據的統計分析,從而對未來未知數據作出評判.
這裏對未知數據作出評判,也成爲分類或是決策.
在人工智能領域,分類,決策,判斷,預測 這幾個詞基本上是同義詞.
好比: 風險投資面臨不少初創公司, 投仍是不投資,這是個決策,也是預測和判斷
這個決策,也至關於把候選公司分爲兩類,一類是要投資的公司,一類是不投資的公司.大數據
嚴格的來講人工智能,不能算作科學,爲何呢?人工智能
近來谷歌AlphaGo在圍棋比賽中屢次打敗人類選手,在全世界掀起了人工智能浪潮,
AlphaGo憑藉什麼贏得比賽? 不少人認爲靠的是谷歌的高科技,這個很籠統
更專業一點講,就是: "憑感受".
"AlphaGo評憑感受打敗人類選手"
沒錯,就是"憑感受", 也能夠說"憑經驗",總之不是憑藉"邏輯推理".
在人工智能領域,經驗和感受,是一個同義詞,
因此也能夠說"AlphaGo評憑經驗打敗人類選手".設計
"AlphaGo的感受和經驗從哪裏來?" 這是基於對海量過去棋譜的學習總結出來的.
在人工智能領域,"學習"這個詞就是統計分析的意思.圖片
圍棋棋譜的黑白結構,很便於掃描識別,每一個局面可記爲一個19X19,每點可爲3個顏色(黑白空)的圖片.
這樣一盤棋下來,就對應一系列的有序圖片,而對海量數據的統計分析是電腦的強項.get
AlphaGo在對戰以前,對過去海量優秀棋譜作了統計分析,簡單的說就是,AlphaGo存儲了海量的棋譜,
AlphaGo閱棋無數,經驗豐富,要走下一步時,AlphaGo會把當前的局面與海量的棋譜作比較,圍棋的變化是天文數字,固然不可能找到如出一轍的對局,
他會找到最近似的對局,從而走出下一步.
(這裏只是一個簡化的描述,實際要複雜的多).數據分析
AlphaGo雖然棋藝精湛,當對於其下的每一步棋,他並不知到對錯,須要依賴人來作檢驗.
AlphaGo和李世石的對局中,曾經下了一步臭棋,輸了一局, 試想一下,若是李世石想逗AlphaGo玩,
在AlphaGo下錯時,故意亂下,故意輸棋, 這樣AlphaGo並不會發現本身的錯誤,反而會把臭棋當妙棋.數學
若是一個圍棋九段高手在觀戰,對AlphaGo的一步棋提出質疑:"爲何要下這裏,而不是那裏?"
假設AlphaGo會講話,他會這樣說:"我感受這裏要好些,你說的那裏也不錯"
這裏想強調的是, 科學一般會有確定的結論, 人工智能只能獲得一個大體的結論.
如今常常有人組織人工智能算法大賽,比的是一個算法判斷的正確率.
正確率高的算法就是好的算法,
而經過人工智能得出的結論,不會百分百正確. 甚至能夠這樣說,若是一個算法可特到百分百正確的結論,確定不是人工智能.
總結下: 非邏輯推理, 不能自身驗證對錯, 得到近似的結論是人工智能和科學的最大不一樣點.
人工智能裏, "人工", 字面上的理解就是人造的, 與其相對的就是: "天生".
好比有的人的雙眼皮是天生的, 有的人的雙眼皮是人工的.
人類屬於高智能動物,天生具備智能.
理解人類天生智能的運做,對於理解人工智能的運做頗有幫助.
咱們來看看人類天生智能的是如何運做的.
一個三歲小孩, 喜歡吃糖.
小孩哭鬧的時候, 奶奶就給他糖吃.
幾天內,小孩每次哭鬧,都吃到到了糖.
這時小孩就會獲得一個結論:"哭鬧就有糖吃".
以後,想吃糖的時候,哭鬧就能夠了.
咱們仔細分析一下這個過程:
一開始,小孩並不知道哭鬧能夠有糖吃,
通過幾天的實踐,得出"哭鬧就有糖吃"的結論.
注意這個結論: 是基於對幾天的數據統計得出來的,並非經過"邏輯推理"得來的.
這個結論大體正確,但不是百分百正確,是基於經驗的結論.
幾天內哭鬧就有糖吃的數據, 就是如今所說的大數據, 不要覺得只有海量數據纔是大數據.
有一次是爸爸帶這個小孩,小孩想吃糖了,就開始哭鬧,結果捱了一斷訓斥,糖沒吃成.
幾回下來, 這個小孩修正了以前告終論: "在奶奶面前哭鬧,就有糖吃".
從"哭鬧就有糖吃" 到 "在奶奶面前哭鬧,就有糖吃",這是一個經驗積累和學習的過程,正確率有了提升.
其實,小孩子不會意識這個過程,這是一個天然的天生智能過程
這個過程和人工智能的運做幾乎是如出一轍的.
人類在成長中,多數經驗是經過統計而來的.
開篇提到"人工智能沒什麼了不得的,中國人五千年前就發明了人工職能".
什麼是中國傳統的人工智能?中醫學,相面學,風水學這些就能夠說是古代的人工智能.
這些學問大都是經驗之談,基於統計分析,而不是邏輯推理,大體正確會有例外.
這和現代的人工智能極其相近.
以中醫學爲例,說說和人工智能的關係.
好比一我的口腔發炎,對西醫來講就是,查血,白細胞多,說明有炎症,要消炎.
對中醫來講, 就是上火了,要清熱解毒.
西醫是有嚴密邏輯推理的,由於白細胞多,因此有炎症,西醫是嚴謹科學,明確沒有例外.
而中醫是基於經驗了,中醫理論就是古人經驗的積累, 簡單的說就是: "口腔發炎啊,依據之前的經驗就是上火了,要清熱解毒".
而之前的經驗是否適合如今的實例呢,這就有點想人工智能,大體正確,但不能保證百分百正確.
因此不少中醫師都會說:"先吃三天的藥,沒好轉再來看一看"
由於中醫是基於經驗了,因此不少時候中醫不被視爲科學.
這也是爲何我說現代的人工智能不算科學的緣由.
若是人工智能是科學,那中醫也是科學.
中醫學在數千年的發展中,其豐富的經驗是創建在大量診斷案例的基礎上的,也就是如今所說的大數據分析
對大量樣本數據的收集整理,提取特徵值,統計分析,從而對未來的樣本作出有效的分類,這個是中醫和現代人工智能的共同點.
但從判斷的正確率來看, 中醫的正確率要低於現代人工智能.
現代人工智能在一些領域,好比手寫識別,識別率可超過95%, 中醫對疾病的判斷,很難達到這樣的正確度.
究其緣由,中醫主要靠人來分析, 人工智能利用了現代電腦, 不管運算能力和存儲能力都超過了人.
還有對樣本特徵值的提取和記錄,現代人工智能經過數學向量或是矩陣來記錄,更爲客觀.
中醫對樣本特徵值的提取和記錄,經過陰陽,表裏,寒熱,虛實,金木水火土等表述,不是很明確,不一樣的人有不一樣的理解.
還有在發展過程當中,中醫內部的信息溝通也不順暢通,因爲這些特色,中醫在技術傳承和積累上明顯不如西醫和人工智能.
由於有效的傳承和積累,未來的西醫和人工智能確定比如今的強,如今的確定比過去的強.
而中醫領域,經常出現如今的不如過去的狀況.
現實生活中不少事情是基於經驗的.
現實生活中,不管是招聘,仍是相親,都要求對方是身體健康的.
如今企業招聘員工,爲了保證招來的員工是健康的,一般須要入職員工提供體檢報告,
這是一個科學的,西醫的思惟方式,經過查血,胸透等體檢報告證實本身是健康的.
一樣相親過程,一樣也要求對方是身體健康的,如何判斷對方是健康的呢.
一般咱們都是經過對方的言談舉止,音容笑貌等外在特徵來斷定一我的是否健康.
這是一個非科學的,中醫的思惟方式,也能夠說是一我的工智能的方式,徹底依賴經驗,大體正確,會有例外.
如今,有些人反中醫,把中醫說得一無可取,這裏對這些人士提個問題:
"回想下,您相親時,要求對方出示體檢報告了沒有?"
若是沒有要求,說明您仍是經過中醫的,非科學的方式來認定對方是健康的.
相親時,要求對方出具體檢報告,聽取來很荒謬,但這確實是斷定健康狀態的科學方式.
(提醒: 急症仍是要看西醫).
如今不少互聯網公司經過對用戶使用數據的收集和分析,具有繪製"用戶肖像"的能力, 這裏的"用戶肖像"不是視覺上的肖像,而是對用戶進行分類.
簡單的說,就是"哪些有錢,哪些沒錢,哪些70後,哪些90後", 複雜一點就是:"哪些喜歡蘋果,哪些喜歡小米,哪些是球迷,哪些是文青等"等用戶興趣愛好, 對用戶準肯定位後,就能投其所好,這是頗有商業價值的.
如今不少手機應用喜歡給用戶推信息,瞭解用戶的興趣愛好很重要,讓用戶反感的話,直接就把應用給卸載了, 這就是大數據和人工智能分析.
這其實也不是新鮮事,一些有經驗的營業員,顧客一進店,經過顧客的衣服,褲子,皮鞋,飾品,年齡,拿的手機,說話口音等特性值,就可以對這個顧客作定位, 這個顧客會不會買產品,會買什麼樣的產品.
對顧客正肯定位後,就能把精力集中在有效的顧客上,提升業績.
這樣的人,現實生活中,被成爲"以貌取人,看人下菜",你們都不喜歡. 但其原理和如今的大數據和人工智能分析一模一樣.
地域偏見話題,本想避而不談,當這是一個客觀存在的現象,不能僞裝沒看見, 正好和人工智能有關,這裏談一談.
現實生活中,經常會遇到地域話題, 好比: 北京人,上海人,廣州人,西安人,成都人,重慶人,武漢人,東北人,河南人,武漢人,雲南人怎麼怎麼樣.
說某某處的人怎麼怎麼樣,這是一個基於經驗,非科學的判斷,如同人工智能.
以上海人爲例:
公司裏有三個上海籍員工,爲人挺好,就是斤斤計較,很小氣.
如今公司新來一個員工,也是上海人,不少人就會認定這個新員工確定很小氣.
分析一下這個現象:
新來員工和以前的三我的沒有任何關係,是不一樣的人, 由於前面三我的小氣,而認定新員工也小氣,這是不符合邏輯,也是不科學的.
前面三我的小氣,就是大數據, 經過大數據統計分析,來對新人定位,而這個評經驗的斷定過程其實和人工智能和類似,簡直就是一回事.
這裏以上海人爲例,主要是考慮到,上海人自信足以面對調侃, 再說小氣也不是多大的貶義,上海人相應的嚴謹認真,契約精神是很正面的.
在現實生活中交友,相親,商務來往,經常須要對人作出評判,簡單的說就是"可靠,不可靠".
一些人不識人,容易上當受騙, 而一些人的眼睛,很厲害,一眼能把人看個透.
這用人工智能的話來講,就是判斷正確率的高低問題.
人工智能要達到高識別率,有兩個重要條件: 1, 海量的樣本數據. 2,優秀的算法.
這和現實中識人相似, 年青人涉世淺,接觸的人少, 也就是樣本數據少,或是樣本數據單純,因此經驗淺
年紀大的人,涉世深,接觸的人多,也就是樣本數據多,樣本有普遍表明性,因此經驗豐富.
固然,要有較高的識別率,除了閱人無數外, 頭腦聰明也是必需的. 頭腦聰明就至關於算法優秀.
人工智能平常的應用十分普遍, 這裏挑幾個說一說:
風險投資決策,企業招聘員工,金融機構對客戶的信用評估,在這些決策裏,大公司都有專業人工智能算法輔助決策.
一些小公司憑藉主管經驗來決策,也能夠說憑人類天生智能來決策.
在一些大型的風險投資機構和金融機構, 他們都擁有一流的人工智能算法輔助投資信貸決策,
即使這樣,依舊有失敗的投資或是信貸案例,這就是人工智能.
由於沒有百分百的辦法,有一個正確率較高的算法老是要好一些.
和不少人有關的就是招聘和應聘,大公司有一套人才篩選機制.
你去應聘時的簡歷,面試考評,有些公司還有在線性格評測, 全部的這新信息,就構建成了應聘者的一個數學模型,
而後經過人才篩選機制過濾,這個篩選機制多是主管靠經驗來肯定,也多是人工智能算法肯定.
任何公司的人才篩選機制,都是爲了獲取優秀人才,但也會有一些人才由於篩選機制擋在門外.
最多見的招聘要求就是: 本科以上學歷.
這實際上是一個最簡化的人工智能模型, 僅僅經過一個指標來評測.
這個學歷要求, 咱們稱爲門檻, 在人工智能領域,有個對應的術語,叫作"閥值".
客觀的講,用學歷做爲要求選拔人才,不會百分百正確.
有些學歷低的人能力比學歷高的人能力強, 是有這樣的現象.
可是不少公司仍是會設值這個要求, 由於沒有百分百正確的辦法, 由於爲了少數狀況, 下降標準,須要耗費格外的人力和時間.
這裏設計一個基於人工智能的開關, 主要是爲了說明人工智能基本原理,同時也說明人工智能其實能夠很簡單.
對應上班一族,冬天的時候,天亮得晚,天天鬧鐘響起時,天還沒亮, 稍微睡一會懶覺,就容易遲到.
我發現若是鬧鐘響時,同時打開燈,光線對於醒瞌睡頗有幫助,這裏就設計一個幫助起牀自動開燈的開關.
有人會也許會說,這很簡單啊,開關加個定時器,設定個開關時間不就得了,這是能夠的,但這不是人工智能.
這我的工智能開關能夠這樣設計:
細節上,咱們能夠把天天6點到9點的第一次手動開啓,視爲用戶起牀.
通過幾個星期對用戶手動開啓的時間記錄(大數據),以後就能夠自動開啓了(智能),
對於上班一族,這我的工智能正確率仍是很高的, 固然有時候,用戶感冒了,請了個假,想睡個懶覺,就會發現這我的工智能不是很智能, 這就是人工智能的例外.
這個設計是否使用實用,不知道,但的的確確是基於人工智能和大數據分析的.
對於普通讀者,人工智能經常被講複雜了,人們喜歡把問題講複雜了,一般有兩種狀況:
一種狀況是做者本身也不懂,就是堆砌一些英文直譯新名詞,因此讀者天然也看不懂,讀者看不懂,天然沒法質疑;
另外一種狀況是,科學家過於嚴肅認真,怕文字不嚴謹,擔憂寫錯了誤導讀者,總喜歡用數學公式來描述,因此大衆看不懂.
本文的本意就是一篇易懂的科普文章, 不免有不嚴謹或是錯誤之處,還望專家學者斧正.
做者: 黃洪清
2017年8月20號於成都
原文地址: http://www.jianshu.com/p/ad3945f4427c 本文系原創,轉載需不改變原文標題和內容,而且包含原文連接地址.