智能音箱可否成爲人工智能的首張王牌?百度DuerOS給出了答案


  人工智能領域再度熱鬧起來,這一次是由於智能語音助手。算法


  在百度推出DuerOS開放平臺後,國安廣視搭載DuerOS的新一代G2人工智能機頂盒及智能語音遙控器又落地河北。將來2年內,河北全省預計將有200萬+用戶享受人工智能帶來的生活改變。與此同時,阿里也推出一款內置中文人機交流系統AliGenie的智能音箱,加上騰訊在此前推出的小微智能語音解決方案,智能音箱已然成爲BAT的又一戰場,而誰能成爲中國版的Echo也成爲科技圈的一大談資。微信


  可在業界看來,阿里以及號稱要在八月份發佈本身的智能音箱的騰訊,更像是智能語音領域一個遲到的「覺醒者」。距離亞馬遜Alexa的推出已經有近兩年的時間,蘋果的Siri、Google的Assistant、微軟的Cortana等也在推出時間上佔據優點。即使在國內,Fast Company 在去年年末就將百度排在最具創新的 AI 和機器學習企業榜單第三位,僅次於 Google 和 IBM。百度深度語音識別系統Deep Speech2更是入選MIT 2016十大突破性技術。機器學習


  正如第三方分析機構Canalys分析師賈沫所說,智能音箱對人工智能技術要求很高。儘管目前語音識別方案較爲完善,可是在深度學習等人工智能技術上並非短期內可以彌補的,只有深耕人工智能纔有可能成爲大玩家。編輯器


此次,百度的DuerOS走在了最前面佈局


  巧合的是,在阿里推出「天貓精靈X1」的同時,百度也在其AI開發者大會也首次系統闡述了百度對於AI語音交互領域的重視以及野心,以DuerOS開放平臺爲支撐,試圖在AI領域再造安卓式的操做系統生態。學習


  一個瞄準了智能硬件,一個要作安卓式的操做系統生態,與百度相比,阿里在智能語音交互領域的動做仍是晚了很多。大數據


  巨頭們紛紛瞄準智能音響,在某種程度上確認了科技領域的一個既定事實,即語音將成爲下一代交互入口之一,甚至會在某些領域取代現有的圖像、動做等人機交互方式。而想要實現這一宏偉目標,僅靠智能音響這一純粹的硬件產品恐怕是難以實現的,畢竟智能音響還須要經歷數據積累、業務完善、雲端服務部署等一系列流程。人工智能


  阿里和百度不一樣的選擇,和兩家公司對人工智能的認識不無關係。早在 2013 年年初,百度就成立了百度深度學習研究院(IDL),並在三個月以後在硅谷成立了硅谷人工智能實驗室。而在當時,人工智能這個概念在業界方興未艾,大公司中也僅有百度等少數玩家嘗試進行系統性的佈局。隨着業界對人工智能領域在將來的不斷看好,科技巨頭們相繼改變了對人工智能的態度:若是你失去了這塊領地,那你也將失去將來。spa


  從2014年開始,阿里、騰訊等開始陸陸續續佈局人工智能領域,試圖跟上百度等先驅者的節奏,並致使智能語音交互成爲彼此交鋒的戰場之一。只不過,當追隨者還在琢磨智能硬件做爲發力方向的時候,百度的DuerOS已經開始了開放生態的探索。操作系統


爲何說生態纔有將來?


  BAT爲什麼要把戰火燒向了智能語音交互領域?一個公認的說法是,智能語音交互是基於語音輸入的新一代交互模式,所以也被視爲是新的物聯網入口。


  誠然,做爲一種新型的人機交互模式,智能語音交互能夠實現人機對話,即經過說話就能夠獲得反饋結果。將智能語音系統搭載終端硬件,在這樣的「配合」下,製造商們得以進入家庭的每一個角落:在客廳看電視,在臥室吹空調,在廚房用冰箱,而這些也將成爲物聯網時代下人機共處的具體場景。


  換而言之,若是語音交互取得普遍應用,智能語音系統企業獲利的同時,還將帶來從元器件到內容服務全產業鏈的重構。對此,百度也直接放言,對話式人工智能系統DuerOS將成爲百度在下一個時代重回巔峯的核心。


  然而,要實現這樣的場景,不只須要深耕語音語義識別技術,還需構建完善的生態。從PC時代的Windows,到移動互聯網時代的安卓和iOS,再到智能語音時代的百花齊放,巨頭們一直想要實現的就是打破信息孤島,而開放每每被證實是最正確的答案。在人工智能時代有着一樣的商業邏輯,在系統級層面進行開源和開放,吸引足夠多的服務和硬件合做夥伴,鏈接起更多的終端和數據,最終實現「萬物互聯」的場景。


  爲了構建生態,百度作出了兩個重要舉措,一是收購了專一語音喚醒和天然語音交互技術的人工智能創業公司KITT.AI,並相繼發佈了DCS(DuerOS Conversational Service)和DBF(DuerOS Bot Framework)兩大基礎協議,使得DuerOS成爲國內軟硬一體的「最全」解決方案;二是百度在硬件上跟科勝訊、英特爾、MTK、Rockchip、全志、RDA、Realtek、高通等公司合做推出了不一樣的開發套件,包括套件的我的版、輕量版、標準版以及開放電路板設計、開放結構設計等完整一體化參考設計,以吸引更多硬件廠商的加入。


百度的作法有何啓示?


  固然,在人工智能的風口下,試圖從系統層面作開放的毫不止百度一家,包括科大訊飛、雲知聲等也有所嘗試,但百度的作法押對了嗎?


  百度將DuerOS開放平臺分爲智能設備開放平臺、對話核心系統、和技能開放平臺三層。簡而言之,對話系統提供算法能力,好比語音技術、天然語言處理技術、搜索技術、多輪對話技術等能力,以及知識圖譜等大數據;技能層,整合了音樂、有聲、新聞、娛樂等10大類、100多種生對話技能和愛奇藝、懶人聽書這類第三方內容資源,免費開放給開發者;算法層就是上文所提到的幾種軟硬結合的解決方案。


  不難理解百度的野心,經過這些開源的技術和服務,開發者們能夠實現不一樣場景的智能應用,輕鬆設計出知足本身需求的產品,而非侷限在「音箱」的形式上。語音交互平臺搭載終端硬件,成就更多的智能產品,進而搭建起良性的生態產業鏈,這纔是百度如今和將來的發力重點。


  可以證實這一策略行之有效的,或許仍是亞馬遜Echo的成功。Echo在發佈之初彷佛並不討市場喜歡,即使在音質輸出和設計方面均不輸專業級產品,亞馬遜還推出了一套完整的音樂流媒體服務。而當諸多的開發者接入Echo,亞馬遜也嘗試着將Alexa開放給更多開發者,使得這款智能語音助手更加「好玩」的時候,銷量便開始一路水漲船高。


  DuerOS的討巧之處在於,只須要修改17行代碼,就能夠在幾秒鐘內把搭載亞馬遜Alexa的設備遷移到百度DuerOS,極大地方便了開發者的「陣地轉移」,尤爲對國內的開發者而言,而在這以前,整個過程至少須要五個研發人員花費3到6個月的時間。百度度祕事業部總經理景鯤也所以向開發者公開呼籲,在中國選擇DuerOS。


  總的來看,BAT等巨頭們擁抱語音交互已是不爭的事實,只是阿里在生態的搭建上則多少顯得有點瞻前顧後,雖然推出了AliGenie平臺,但與百度DuerOS鼓勵第三方開發產品合做雙贏不一樣,阿里的重心仍是自家產品。而騰訊在這個領域還還沒有造成清晰的戰略佈局。


  那麼問題來了,阿里和騰訊是否會二次覺醒,在智能語音呀領域再次跟着百度DuerOS的節奏走起來嗎?

Alter聊IT

已入駐搜狐、百家、界面、虎嗅、鈦媒體、雪球、知乎等30餘家平臺。


長按指紋 > 識別圖中二維碼 > 添加關注

Alter聊IT,通俗易懂 不是磚家

本文分享自微信公衆號 - Alter聊科技(spnews)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索