AI 滔滔是CSDN旗下一檔關於科技類的評論節目,內容涵蓋當下的科技熱點內容,歡迎廣大科技愛好者關注。
前端
做爲消費級AI應用的首個載體,智能音箱今年特別的火。後端
但故事卻要從2014年提及,當時亞馬遜在其官網上低調的上線了一款智能音箱Echo,它搭載了Amazon 自家的智能語音助手Alexa,外形和普通的藍牙音箱沒有太大的區別,也沒有顯示屏,惟一的交互方式就是語音。經過智能語音助手,用戶能用簡單的語音指令就能夠查詢信息、播放音樂、設置提醒,甚至控制家裏的智能設備。微信
2015年Echo 年銷量爲250萬臺,2016爲520萬臺,時至今日,Echo的總銷量已經達到千萬量級,真正走進了千家萬戶。亞馬遜在智能音箱上取得的成功引來了衆多的競爭者和跟隨者,美國本土市場有谷歌、蘋果、微軟等巨頭效仿,國內有科大訊飛、阿里、小米、出門問問、Rokid等玩家紛紛入局。佈局
在Alexa目前徹底hold不住中文的空檔期,Copy to China 模式依然方興未艾的大背景下,誰能成爲中國版的Echo成了科技圈內不斷被熱議的話題。學習
本期AI滔滔,CSDN創始人蔣濤老師將從小米智能音箱的發佈提及,跟你們聊聊語音交互的那些事兒。蔣濤認爲,目前以手機爲首的觸屏創新時代已經結束,語音交互的新時代拉開序幕,不少觸控的操做方式將來都有可能被語音所取代。測試
談及不少國產的智能音箱並未複製Echo在海外的成功的緣由,蔣濤認爲,不少產品並無找到用戶真正須要使用的場景並完善產品體驗。但對於小米AI音箱的將來,他卻樂觀的預測小愛同窗將會成爲一款銷量數百萬的現象級產品,而且剖析了具體緣由。阿里雲
除了對產品的橫評,蔣濤還縱論了目前BAT、小米、科大訊飛等主要玩家在語音交互領域的戰略佈局狀況。spa
最後,做爲CSDN和極客幫創投的創始人,蔣濤認爲對於開發者和創業者來講,如今想作一款突破性的手機APP已經很難了,須要密切地關注語音交互這個新領域,而目前這個場景開發者還很少,是個入場的好時機。操作系統
特別鳴謝聲智科技在本視頻錄製階段的大力支持!設計
如下爲本期AI滔滔的文字整理:
蔣濤:滾滾長江東逝水,全憑濤濤一張嘴。你們好,這裏是AI滔滔,我是主講人蔣濤。
咱們剛纔測試了一下小米新發布的AI音箱,咱們預測它會帶來一個爆款式的現象。這個現象在美國已經發生了有3年,2014年亞馬遜發佈了一個Echo,不聲不響的,可是這個Echo在今年的CES爆紅,成爲真正的下一代智能硬件的一個突破級的產品。
如今你們一致公認手機的創新時代已經結束,咱們如今看到,即便蘋果今年10週年,它拿出來的產品也沒有太多的一個創新,因此你們都在指望着看到一個新時代。這個新時代有不少的預測,其中最重要的一個觀點就是說,咱們從所謂的這種觸屏時代,會被語音輸入所取代,這個產品已經被亞馬遜作出來。
中國的廠商其實在3年前也注意到了亞馬遜這款產品,有不少的模仿者和追隨者,其中呢,力度最大的是科大訊飛和京東合做的叮咚音箱。由於科大訊飛在語音這個領域耕耘了不少年,又藉助京東的這個銷量,想模仿亞馬遜的成功。但是兩年下來,銷量應該說徹底沒有達到預期。
可是咱們今天測完小米這款AI音箱,我以爲有可能會迎來一個跟亞馬遜Echo同樣成功的產品,緣由呢,固然我以爲如今是技術的一些進步帶來的。
首先,是語音的識別力在最近的這幾年有很是大的突破;
第二個語音在音箱上的應用,它還用到了另一個技術,這也是亞馬遜作得比較獨到的一個地方,就所謂遠場語音識別。可是在國內你們還在摸索,小米音箱呢,咱們實驗了一下,它的遠場的這種效果它的靈敏度和反應速度已經達到了一個用戶能夠以爲很是好的一個溫馨度。
更重要的是小米它有強悍的供應鏈的能力,因此它把這個音箱的價格作到了299,並且它的整個的設計,和音箱的這個材質體驗都仍是很是棒的。
因此呢,小米音箱咱們判斷,它是有可能爆款的,這個爆款就說,至少它是個百萬級的,它有但願衝到三百萬或者五百萬的這個量級,那可能就是除了手機這個市場,咱們智能手機帶來大的硬件的升級換代以來,最重要的一個硬件的升級了。
亞馬遜的這個Echo發了三年,你們都用它來作什麼呢?這其實是有一個統計報告的,你們用它最多的四樣事:聽歌曲;調整燈光;設置鬧鐘;查天氣。
咱們能夠看到,語音它開創了一種新的場景形態,就是你要作一個單一的一個任務,這個任務很明確,用手機去作的時候,你就會發現它很煩瑣。你要打開手機,打開APP,而後找到那個功能,再去激發那個功能,最後起到做用,可能要走四步。
可是如今呢,用智能音箱之後,第一呢,它是不間斷的在那,你能夠隨時喚醒它。這樣當你的任務很是明確的時候,音箱就成爲你的很好的一個助理。
爲何前面這些音箱都作的不太成功呢?
就是第一,它們可能在產品的設計體驗上,沒有找到真正的場景點把它解決透,就是實際上音箱的功能不像想象的那樣。特別是有一種誤區,就是如今天貓推的那個天貓精靈就是這樣,用戶能夠經過音箱去下訂單,這是一個很愚蠢的這個想法,你想一想,你要在音箱上去下訂單,這幾乎是不可能的一件事情,這個交互太複雜了,怎麼去選擇你的商品?這個事實上呢,即便亞馬遜動用了這麼大的力量去推它的Echo,大概有6%的用戶會用Echo來查它的定單,94%的人都沒有歷來沒有想到用這個功能。
第二個,首先得是個好的音箱,這是蘋果去作它的叫HomePod,它的智能音箱的一個出發點,說我比你的Echo要作得更好,音質要作得更好。
我以爲百度今年作了一個重大的戰略,要作一個度祕(DuerOS)操做系統,語音的一個交互系統。它把度祕從一個事業部升級成公司的大的戰略部,並且把它那個系統要開放和開源。百度推了一個叫喚醒萬物,和Duer的一個操做系統,它的想法是什麼呢?既然將來這些萬物都要具有聽的能力,那每家公司像小米同樣去開發一套系統嗎?不用了,我百度來作幫大家作好,大家把我這個模塊嵌入進去就好了。
咱們能夠把它比喻一下,在新交互時代,咱們從這種手指的交互進入到語音交互,小米選擇了一個路徑,說咱們要作軟硬件結合的,相似於iPhone的一個解決方案,咱們要作蘋果,把全部的系統都封裝起來,大家在上面去開發應用,就像亞馬遜的Echo,下面有不少號稱有上萬種技能,是第三方開發者在上面開發的一些單向應用,那也就意味着,亞馬遜Echo是成爲一個服務的入口了,咱們已經能夠看到這樣的一個現象,這是小米選擇的路徑。
那百度,包括阿里,他們選擇的 路徑是什麼樣的呢?
阿里如今選擇兩條路,第一,我作個天貓音箱,我也也想幹這個事,我也想學亞馬遜,作這樣一個語音的入口。第二個,實際上它背後是想推它的阿里雲的服務,由於作音箱,如今就不只僅是作音箱自己了,首先你要有AI的能力,AI的 技術,識別,處理,再還有更重要的是後端的雲端的服務能力,他有點像後交互時代,新交互時代的安卓同樣,咱們創建一個生態,這是百度阿里選擇的道路。
騰訊在幹什麼?騰訊在等着你們先作,作完了之後,我再上,由於他有一個殺手級,QQ加微信,用戶在他那,因此他不怕,大家先作吧,等大家先探索出來道路之後,咱們再Copy上。這是咱們目前看到的這個就是所謂智能音箱帶來的這個新交互時代如今的一個格局。
這個我以爲對於創業者,還有咱們這個CSDN的這些開發者來說,我以爲你們仍是能夠很是密切的關注這樣的一個動向,爲何呢?就是說,如今想作一個APP在市場上已經很難突破了,可是咱們若是開闢一個新的場景,如今的開發者仍是不多的,你能夠進入進去。
第一,你也能夠選擇跟小米合做,由於小米里面也須要更豐富的應用;
第二個,更重要的是,將來這些傳統的這些行業和場景都會被智能化。
就像咱們看到一個報告,如今賣音箱排名第一的仍是叫漫步者音箱,這大概是咱們15年前時候 ,買電腦時候就有的一家品牌,它的音箱是什麼樣的一個狀況?它的音箱是個真正的音箱,它沒有記錄你的數據,它不知道你聽的是什麼歌,它也不能理解你能跟它講的話,你也沒法跟它對話,智能的這樣一個用戶體驗必定會改變這些行業的,漫步者這樣音箱若是它不改變,三年以後,它確定是不存在的。
可是它怎麼去改變呢?不光是他一家,可能還有很是多家這樣的音箱廠商,還有可能一些,原來咱們沒有想到的一些環境均可以把這種語音輸入場景用上去,而如今作這件事情,除了你利用小米音箱去作之外,你還能夠在市場上找到很是多的集成的解決方案。
百度提供了一套API接口,雲端的後臺,前端訊飛有語音的識別方案,聲智科技也有識別方案,再加上一個樹莓派,一個小的電腦,你就能夠本身搭建出來一個帶有語音識別能力和後臺雲端交互能力的一個叫智能電腦系統,這個智能電腦系統可以聽懂你說的話,加上攝像頭之後,它還可以看清楚周圍的物體,這時候,他能提供這個解決的能力,就跟原來的咱們電腦系統會很不同的。
因此每一個行業可能都存在這樣的一個機會,咱們也很是歡迎你們把你的想法跟咱們拿來一塊兒交流,若是有這樣的一套系統,你會用它來作什麼?今天咱們就給你們講到這裏,謝謝。
送書福利:
愈來愈多的大公司和創業者已經加入到語音交互的藍海,你是否是也想遇上這波浪潮呢?在此送出五本《解析深度學習:語音識別實踐》,但願能幫獲得你。感謝博文視點的支持。
參與方式:在本文評論區留言,說出將來你以爲智能音箱還可能有哪些應用場景。根據評論質量和點贊數,選出5名用戶,可得到本書。截止時間爲本週五(9月15日)晚22點。
博文視點是電子工業出版社下屬旗艦級子公司。十餘年來,博文視點以開發IT類圖書選題爲主業,以傳播完美知識爲己任,並開展相關信息和知識增值服務。