語音-下一代的顛覆者

如下內容來自於Mangrove Capital Partners的報告 - Voice:Welcoming the Next Generation of Disruptors
算法

原文連接 - https://www.mangrove.vc/voice-tech-report-2019api


在過去多年的鍵盤輸入和點擊手機屏幕以後,咱們正在迴歸到最初的「用戶界面」:語音。雖然咱們還沒有感覺到語音技術帶來的所有影響,但這種技術正在改變咱們與數字世界互動的方式。微信


重要的是,這種轉變影響的遠遠不止是查看天氣預報,獲取音樂,以及設置鬧鐘。語音帶來了平臺和用戶界面的轉變,足以與網頁和智能手機相媲美。做爲人工智能和機器學習的入口,語音技術將經過強大的新方式爲咱們提供服務。網絡


在Mangorve,咱們相信,語音將成爲將來10年決定性的主題之一。除了用數字服務影響各行各業之外,語音技術還將培育出新一代的科技公司。與人工智能一塊兒,語音技術將從根本上改變人和機器的關係,給下一代軟件創造巨大價值。app


向語音的轉移機器學習


自2011年蘋果推出Siri以來,語音技術已經取得了長足發展。隨着機器學習的發展,咱們在語音識別和天然語言處理兩方面都得到了至關大的進步。事實上,語音系統的單詞識別準確率已超過95%,這意味着它們已經具有了與人類相仿的語言理解能力。相對於打字,語音產品提供了更天然、更便利、更高效的溝通形式。所以,語音註定將成爲最主要的人機互動接口工具


根據Juniper Research的數據,目前市面上已有25億個語音助理存在。隨着科技巨頭爭相加入競爭,愈來愈多家庭正在啓用語音服務。在美國,家用智能音箱的總數2018年大幅增加78%,從6670萬臺增長至1.855億臺。亞馬遜在這個市場的份額達到64.6%。Canalys預計,全球範圍內智能音箱的裝機量到2023年將增加至5億臺。學習



語音也在成爲智能家居和物聯網的入口。亞馬遜宣佈,已有4500個品牌提供2.8萬款支持Alexa的智能家居設備,包括電視機、炊具和機器人吸塵器。除了進入家庭場景以外,語音助手也在進入萬豪等酒店的房間,而且在汽車信息娛樂系統中也很受歡迎。亞馬遜正在與多家汽車公司展開談判,有報道稱亞馬遜的車內產品Echo Auto預售訂單已超過100萬。Echo Auto提供全方位的免提體驗,包括打電話、導航,以及操控智能家居設備。優化


語音技術也在超越語言障礙。目前谷歌的服務已經支持30種語言,甚至能夠同時理解用戶所說的多種語言。有趣的是,在中國語音服務的普及更快,阿里巴巴在中國的智能音箱市場處於領先。搜索引擎


各種受歡迎應用的出現使人聯想到App Store發展的早期。亞馬遜Alexa提供的功能包括爲新媽媽提供母乳餵養支持,鼓勵孩子們刷牙,幫助用戶鍛鍊,指導足球隊,以及指引人們如何禱告。



語音電商的崛起


因爲亞馬遜Alexa直接關聯至全球最大的電商平臺之一,語音購物也在初步發展。亞馬遜已經看到,Alexa平臺的電商交易在2018年假日季同比增加至三倍。沃爾瑪近期也推出了基於谷歌語音助手的在線生鮮購物服務,支持購物者經過谷歌Home、智能手機或智能手錶將產品添加到購物車。


根據Juniper的數據,在美國和英國,語音電商的規模將從2018年的20億美圓增加至2022年的400億美圓。有趣的是,語音電商最熱門的三大商品品類都是低價商品:生鮮雜貨(20%)、娛樂(19%)和電子(17%)。



所以對零售商來講,得到「亞馬遜精選」的地位將會比以往更加劇要。根據OC&C戰略諮詢公司的數據,亞馬遜購物者中有85%最終會選擇亞馬遜推薦的商品。不過目前外界仍然不清楚,具體商品要如何才能得到這樣的推薦。



不管是在線上仍是線下,語音技術已經在指引消費者購物。快消品廠商正在探索,基於語音體驗,對於製做雞尾酒和品嚐威士忌等場景,能夠如何提高產品定位和用戶忠誠度。



你不會再感到孤單


重要的是,語音服務正在從事務性向對話性轉變。這種趨勢的最終結果很難徹底被理解,但你能夠考慮這一點:你永遠不會再感到孤單,不管是在與Alexa說話,仍是與另外一我的或人工智能說話。人工智能的第一次浪潮使用算法去創建推薦引擎,提供訪問互聯網服務,例如谷歌、亞馬遜和Facebook的快捷方式。而第二次浪潮則是幫助企業利用結構化數據去優化決策流程。相似Palantir的公司開始崛起,它們挖掘大量結構化數據,找出人眼和人腦難以發現的信息關聯性。


人工智能的第三次浪潮正在到來。人工智能得到了眼睛、耳朵和無數其餘感官,從而能夠收集歷來沒有過的新數據,隨後使用這些數據推進更復雜的流程自動化。與此同時,咱們也在從基於命令的靜態流程轉向動態流程。這是計算領域的結構性變化,將完全改變咱們體驗軟件,與軟件交互的方式,模糊了數字世界和現實世界之間的關聯。


隨着人工智能系統在對話中變得更熟練,收集關於人們及其周圍世界的更多數據,它們將能夠了解情景信息。人類一般能夠不費力地掌握這些關聯信息,並將其應用在對話中。情景信息將幫助人類和機器以更天然的方式互動和協做。而隨着體驗的優化,變得更有用,他們將會更加頻繁的互動,而機器也將掌握更多知識。


這樣的良性循環意味着,在將來3到5年內,計算機的對話能力將變得更復雜,更具變革性。與其將咱們的時間花在鍵盤打字和智能手機觸控上,咱們能夠很方便地與無所不在的人工智能交談。重要的是,咱們與軟件互動的方式將被永久改變:表單將會消亡,接觸點將變成「監聽點」。


這就能夠解釋,爲什麼全球最大的科技公司向語音技術進行了大筆投資。語音技術帶來了平臺和用戶界面的改變,這足以媲美此前的網頁和智能手機,而不一樣之處僅僅只是,用戶向語音的轉移不須要任何訓練。對於這種將來主導性的平臺,大型科技公司不容有失。所以,亞馬遜已有超過1萬名員工從事Alexa項目,而亞馬遜也是對語音技術創業公司最熱衷的投資方之一。



語音優先界面的黎明



語音技術的影響很是深遠,每家公司都須要從新考慮如何與用戶進行互動。這不只僅是調整SEO(搜索引擎優化)等方面的工做,或是開發本身的Alexa「技能」或谷歌的「操做」。


企業最終須要提供能感知情景、語音優先的界面。能創建用戶認知和情感鏈接的企業將能夠更好地吸引用戶,而若是隻是用預設腳本去被動響應用戶問題,那麼企業將處於明顯的劣勢。嚴重依賴通知去驅動應用使用的科技公司可能須要從新審視策略。消費者對於那些用太多通知去打破「聲音門檻」的公司(例如LinkedIn)不會再有太多耐心。


最熱門的移動應用成爲了今天的主導平臺,而最能吸引用戶的語音優先界面將會成爲明天的主導服務。很難預測理想的界面應該是什麼樣,但下一代Airbnb、Monzo和Uber的出現極可能只要3到5年。


無屏幕手機,例如Light Phone的出現向咱們展現了將來,這樣的手機不依賴於咱們瞭解並喜好的移動應用。考慮到語音服務的學習曲線很短,能明顯減小用戶的使用障礙,所以能夠很合理地假設,在咱們注意到所有潛力以後,語音經濟將快速發展。



語音時代的工做


在咱們與軟件交互的過程當中,所花費時間最長的場景就是工做。所以能夠合理假設,在工做場景咱們將會看到最明顯的變化。儘管咱們可能仍然須要與屏幕互動,但鍵盤極可能會變成多餘的。畢竟,普通人每分鐘能夠用鍵盤輸入40個單詞,但卻能夠說出150個單詞。


無所不在的人工智能能夠支持咱們平常工做中的許多任務和流程,例如回覆電子郵件,整理會議信息,向團隊成員發佈信息,以及用數據更新相關係統等。這也可能意味着,咱們將再也不被捆綁在辦公桌,沒必要再久坐不動。


更進一步,無所不在的人工智能能夠注意到效率最高的員工,並告知他人他的工做方式,從而優化工做產出。能持續識別高績效者的特定策略,並將最佳績效建議分發給網絡中其餘人的人工智能學習循環已經開始出現。這些優化網絡不是爲了取代人工,而是依靠人類去學習並優化流程。人類仍然會處於循環中。


一個值得關注的案例是Chorus.ai,該服務能加入通話,同時就有效回覆作出提示。Chorus.ai並非給銷售電話提供預設的腳本,而是會分析團隊成員的不一樣方法,帶來更積極的成果,並鼓勵創造性。


經過讓人類變得更聰明、更高效,新一代的SaaS(軟件即服務)產品將能夠收取更高的訂購費用,從而成爲更具價值的一代企業軟件。



從虛擬人物到虛擬醫生


虛擬KOL莉兒·米克拉(Lil Miquela)

咱們已經看到,虛擬KOL逐漸興起。例如,來自洛杉磯、19歲的虛擬KOL莉兒·米克拉(Lil Miquela)在Instagram上積累了150萬粉絲,目前已經參與過Calvin Klein等知名時尚品牌的營銷活動。


位於舊金山的創意工做室Fable正在虛擬人物方面邁進更多一步。該公司的虛擬人物具備完整的互動能力,而且有本身的個性。很快,咱們就能建立人工智能全息伴侶,例如《銀翼殺手》中的喬伊。喬伊由Wallace Corp製造,能夠成爲「你想看到的所有一切」。


虛擬人物極可能會改變娛樂和客服的表現形式,與此同時在給老年人和其餘須要幫助的人羣提供服務方面也能夠扮演關鍵角色。畢竟,被認爲孤獨的人羣健康降低的風險要高出59%,而社交孤立也是形成抑鬱症的最多見緣由之一。


總部位於巴塞羅那的Safe365做爲由科技驅動的社區和互助網絡已經吸引了許多老年人。語音產品提供了對用戶很是友好的方式,監控健康和認知能力,並提供關於鍛鍊和服藥的提醒。


事實上,語音和人工智能最終有可能徹底取代醫生。K Health已經開發了一款人工智能,將數千名醫生的經驗結合在一塊兒,以作出準確的診斷。藉助語音技術,人工智能還能夠像人類醫生同樣給病人提供安慰。



對語音技術融資的分析


根據咱們的分析,對語音創業公司的投資正在加速。語音技術創業公司今年已融資7.86億美圓,遠遠超過2018年的5.81億美圓以及2017年的2.98億美圓。這樣的融資增加代表了市場的信心,即語音技術將帶來變革。融資的規模也在大幅上升,2019年到目前爲止平均交易規模是3000萬美圓,而2018年和2017年分別爲1800萬美圓和1750萬美圓。



娛樂和播客是已經吸引了大量興趣的領域之一。Spotify收購了播客創業公司Gimlet和Anchor,總共花費3.37億美圓。這個領域其餘值得關注的創業公司還包括製做語音優先收費內容的Sybel。



與此同時,從2015年成立以來,亞馬遜Alexa基金已經進行了72筆投資。過去18個月中,該基金投資的創業公司涉及娛樂、健康、教育、交通、電商、酒店和SaaS等行業。這代表,亞馬遜相信語音技術將改變一系列行業。


咱們的分析還顯示,在語音技術創業公司的融資活動中,美國處於領先。美國此類創業公司得到了超過10億美圓的投資,而歐洲只有1.18億美圓。這尤爲值得關注,由於語音技術表明着範式轉換。若是歐洲但願在下一代技術發展中創建本身的地位,歐洲的創業者和投資人須要快速作出響應。



挑戰


語音技術領域最大的挑戰之一是隱私保護。微軟的數據顯示,41%的語音助手用戶對信任、隱私和被動監聽感到擔心。谷歌Nest設備中被發現存在隱藏的麥克風形成了不利影響,而亞馬遜申請專利「監聽房間裏的全部對話」也是如此。


如何迴應這些關切取決於科技公司,而蘋果在這方面的工做卓有成效。蘋果收購Silk Labs值得讚揚,後者開發在設備中運行的人工智能軟件,而沒必要使用雲計算平臺去處理數據。


蘋果在圍繞語音服務構建生態方面進展緩慢。實際上,蘋果1987年提出的「知識導航工具」給出了更明確的語音服務願景。語音服務社區指望蘋果在2020年全球開發者大會(WWDC)上爲開發者社區發佈Siri操做系統,從而加速創新和普及。


Voicebot.ai的編輯和出版人佈雷特·金塞拉(Bret Kinsella)表示:「Siri操做系統對於鼓勵創新是有必要的。許多人認爲,蘋果須要匹配亞馬遜和谷歌語音助手取得的進展。」


《機械姬》等熱門電影中提出的一個問題是,若是咱們癡迷於機器人,愛上代碼而不是其餘人,那麼人工智能將成爲人類的威脅。儘管對某些人來講這種說法聽起來很牽強,但約會模擬遊戲已被證實很是受歡迎。在中國,名爲《戀與製做人》的遊戲在上線首個月下載量突破700萬。


儘管挑戰了咱們對隱私保護的觀念,就人類與技術的關係提出了新問題,但咱們仍然有不少理由對語音技術保持樂觀。這種技術將驅動新的生產力提高浪潮,造福消費者、企業和社會。而且,這也將幫助咱們更好地照料老年人,同時讓全球7.74億不識字的人羣可使用互聯網。



語音時代的預測


  • 鍵盤的消亡:咱們再也不須要打字,而是可使用語音和手勢。鍵盤將在將來5到10年內基本上消亡。


  • 語音技術將帶來全新的產品門類,包括無屏幕智能手機。


  • 品牌很快須要經過「聲音身份」來被識別,產品搜索將被完全改變。


  • 由於在使用語音服務時用戶不太能注意到具體應用,所以硬件將從新變得比軟件更重要。


  • 虛擬伴侶將變成現實,知足你生活的所有需求。


  • 蘋果將於2020年推出Siri操做系統,從而在語音經濟中推進巨大的創新。到2025年,語音經濟的規模將達到1萬億美圓,超過移動應用經濟。


本文分享自微信公衆號 - VoiceVista語音智能(AIndustrialRock)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索