相信沒有人是先上學而後才學會說話的,在咱們張口開始學習說話的時候,爸爸媽媽也不會給孩子們說什麼主謂賓定狀補這樣的語法,而是一句一句的教咱們怎麼說,那句對,那句錯。在咱們學習語法以前,早已能夠和別人流暢的交流了。機器學習
上世紀,藍色巨人IBM公司決心利用計算機技術,開發一款翻譯軟件,因而將各類語言的字、詞、語法都編進了程序,在隨後的實際使用中發現,在聯合國大會這種正式場合,翻譯的準確率至關高,可是在其餘平常場景下,徹底沒法使用。道理很簡單,國際大會這種場合,發言稿都是教科書式的標準,而平常語言,徹底毫無章法,不符合語法是正常狀況。面對這種狀況,IBM嘗試了不少辦法,最終都沒法解決。ide
大數據又是如何來解決這個問題,舉個例子,我要表達我餓了,我能夠有不少種說法「我餓了」,「如今給我吃什麼都香」,「我都前胸貼後背了」,大數據就是將這些話全都收集起來,統一歸類到一個意思,「我餓了」,那麼爲了能覆蓋各類可能的說法,就須要去收集大量,海量的關於「我餓了」這個意思的各類說法,當收集的量足夠大時,任何人說的一句這個意思的話,均可以在這個庫裏找到對應或者類似度很高的話,那麼就能夠定義是「我餓了」。學習
如今超市裏出現一種自動識別物品的承重稱,你用袋子把水果裝好,往稱上一放,攝像頭拍一下就知道你放的是什麼水果,我想也是這個原理,程序裏並無定義蘋果應該是什麼樣子,多大,多圓,表皮什麼顏色,等等,而是放上幾百上千張各類蘋果的照片,比對一下就知道了。大數據
從上面能夠看出來,大數據、機器學習,會須要海量的存儲空間和算力去處理數據。其實咱們人腦的學習過程,不也就是這樣的嗎,媽媽告訴你這是蘋果,那個是蘋果,你就記住了,這樣的就是蘋果。這麼看起來,人腦還真是厲害,消耗那麼一點點能量,卻能完成須要那麼多空間算力才能解決的事情。翻譯