圖像識別技術近來進步飛速。去年,微軟和谷歌展現了能比人類更準確地識別圖像的系統。程序員
這些進步得益於一個叫作深度學習的技術,它涉及將數據經過模擬神經元的網絡,以培養該網絡在將來過濾數據(更多信息見「Teaching Machines to Understand Us」)。深度學習就是你可使用關鍵字搜索存儲在谷歌的照片(更多信息),Facebook 能識別你照片中你朋友的緣由。 在圖像識別上使用深度學習也使得機器人和自動駕駛汽車更有可行性,它甚至能夠完全改變醫學(更多信息)。網絡
圖像識別技術的能力和靈活性來自於, 當人工神經網絡收到不少圖像和圖像類別的信息時,它能夠自動計算出來重要的視覺特徵。在深度學習中使用的神經網絡被佈置成不一樣的層,數據一層一層根據順序經過。在訓練過程當中,在神經網絡中的不一樣的層成爲專門識別不一樣類型的視覺特徵的網絡層。圖像識別中使用的神經網絡類型,被稱爲卷積網,受到了動物的視覺皮層方面研究的啓發。學習
「這些神經網絡相比傳統的計算機視覺方法,是一個巨大的飛躍,由於它們直接從數據中得出結果。」馬修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在內的公司組織和搜索照片和視頻的服務) 的 CEO 說。程序員們曾經須要寫出尋找視覺特徵所需的數學程序,然而這些程序並不能創造出不少有用的產品。google
當蔡勒仍是一個研究生的時候, 他在紐約大學與羅博·宏泰合做開發了一種可視化神經網絡運做的方法。在這個連接中的幻燈片中的圖像將帶你來到這個深度學習網絡的內部,這個用了130萬張照片訓練過,戰勝了人類的圖像識別神經網絡。該網絡識別了 1000 個大相徑庭的物件,包括蚊賬和蚊子,而幻燈片上顯示了每一個圖像中最強烈的激活神經元網絡的一個網絡層的視覺特徵。spa