關於智能產品設計的建議

咱們終將以天然的方式與機器交流學習

在2012年聖丹斯獨立電影節上,影片《機器人與弗蘭克》贏得特別獎,該片講述機器人Robot照顧患有老年癡呆症弗蘭克的故事,選取影片中兩張圖,一張是人與人的交流,另外一張是人與機器的交流。人工智能

在2017年AI大熱之年,人們可否像電影裏的弗蘭克那樣,以人對人的方式與機器交流,這在人機交互學科裏定義爲「人機天然交互」。設計

何爲天然交互?簡而言之就是以平常交流方式與計算機進行交互,何爲平常交流方式?就是人們經過語音、肢體、手勢、眼神、表情等形式進行交流互動。深度學習

 人機交互正邁上新臺階產品

人機交互(HCI – Human Computer Interaction)的發展是從人類適應計算機到計算機不斷適應人類的過程,劃分四個階段:代碼指令交互、圖形用戶界面交互、人機天然交互和人機情感交互。【引自《人機情感交互》】io

每一個階段的發展都是以技術做爲基石,以此帶來的人機交互更爲直觀,也更趨近於人與人的天然交互,同時會拓寬更多的使用場景,會覆蓋整年齡段的全部人。class

以下圖所示,指令 – 專業技術人員操做早期計算機;鼠標鍵盤 – 受過教育的普通人使用PC機進行學習工做;觸屏 – 更普遍的人羣使用智能手機進行社交、資訊、娛樂等;天然交互 – 全部人將以天然的行爲方式與智能產品互動。百度

隨着AI技術的發展,智能產品在感知層面的能力正在變強,它能感知人們的語音、肢體語言、手勢動做、表情眼神等,實現了人機天然交互的可能性,這是正在發生的事情。方法

將來智能產品的趨勢是將擁有情感計算能力(Affective Computing),經過認知人類的語音信息、人臉表情、肢體動做等,從而調整自身的反饋來適應人們那一刻提出的需求,交互會變得愈來愈容易,它會更懂你。im

智能產品能感知人的天然動做和讀懂人的情感,都屬於信息輸入層面。

在信息輸出層面,智能產品如何設計才能達到「人與人天然交流」的感受,爲此咱們將從六個維度給出設計建議,分別是人物設定、外觀造型、語音、動做、界面和光效。正如同人與人交流時對方的脾氣性格、外貌印象、聲音特色、肢體語言、表情和眼神。

以語音交互爲核心功能的智能產品設計建議

1. 人物設定的設計建議

①人設是要爲用戶服務;

人設是高級的虛擬形象設計,不禁設計師的我的喜愛來擬定,要充分考慮產品所服務的目標用戶,譬如病人但願看見的是專家級醫生,旅客但願能得到空姐甜美的服務,食客但願迎賓的店小二是熱情好客的,這些形象在咱們的腦海裏栩栩如生。

好比Amazon Echo是成熟職業女性的形象(相似有Google Home、天貓精靈、京東叮咚等),Olly給人潮流的設計感,它們爲各自的目標受衆羣體去設定形象。

②人設能夠經過抽象的方法進行傳達,並不是必定要具象化;

好比小米智能音箱定義的「小愛同窗」是二次元形象,在今年11月底作出限量版手辦,把形象落地到成具象的實體物品。

對此,仁者見仁智者見智,有人說她不是心目中的「小愛」,因此在人設形象的傳達上,咱們建議能夠經過藝術的手法達到目的,比方說用音樂、繪畫、文學、電影等藝術進行包裝抽象成一套視覺來傳達,達到「空山不見人,但聞人語響」的境界。

③人設與產品要融爲一體的進行考慮;

以語音交互爲核心功能的智能產品,其「人聲」會讓用戶自動的聯想與之對應的形象,同時需考慮與外觀造型相匹配,才能符合用戶預期。

有些智能產品有動做輸出,例如人設定義爲蠢萌的jibo,它的動做就要顯得有趣可愛。

若是考慮不周全,就會致使認知失調產生落差,好比小魚在家,當用戶問它幾歲時,它卻用其成熟女性的聲音回答「我今年兩歲了」,而Amazon Echo的回答是「按照人類的出生年齡計算我今年兩歲」。

後者更能讓人接受與理解,即便是微不足道的一句文本均可能會讓用戶「齣戲」,因此人設要與整個產品的信息輸出層面融爲一體的去考慮。

2. 外觀造型的設計建議

①充分考慮目標用戶的審美與喜愛;

根據目標客羣打造其喜歡的外觀造型,好比小朋友會喜歡jibo賽過Echo,追求新潮的人更喜歡raven R,由於能與之載歌載舞。

與以屏幕爲主的智能手機不一樣,用戶可不能更換主題皮膚找到本身的喜愛,而Google Home也只能是經過「換褲子」來迎合用戶偏好與家居風格。

②基於使用場景考慮造型設計;

要考慮用戶會在哪一種現實環境的場景下使用,目前市面上的智能語音產品多數放置在桌面上,體積大小就要認真思考,好比大了點、重了些,就不方便自由移動隨處擺放,若是定義爲多個使用場景,那便攜上得作到位。

好比raven H頂部的「點陣觸控屏」蓋子,用戶能輕鬆取下進行語音和指觸交互,因而不受固定位置的限制。

 

③避免掉進恐怖谷;

避免與人全特徵的過分類似,建議採用抽象的方法提取擬人元素進行設計表達,這有助於產品向用戶傳達情感信息,從而有效的提高用戶好感度。

例如蔚來ES8搭載的人工智能nomi,還有百度的度祕,都是經過此類設計方法打造智能情感的交互,讓一個工業產品,升級成一個有生命,有情感的新夥伴。

但若是與人的特徵過分類似,現階段的技術能力,造型上作不到寫實逼真像人,同時語音、表情、動做也沒法達到天然完美的匹配,因此這不三不四的設計會給用戶帶來糟心的體驗,例如Blue Frog Robotics公司推出的Buddy,很容易讓用戶掉進「恐怖谷」。

「恐怖谷理論」是由日本機器人專家森昌弘提出, 他認爲,人形玩具或機器人的仿真度越高人們越有好感,但當達到一個臨界點時,這種好感度會忽然下降。

越像人越反感恐懼,直至谷底,稱之爲恐怖谷。如圖所示,谷底處能動的殭屍比靜止的屍體更恐怖,雖然屍體已經夠恐怖的了。

3. 語音的設計建議

①天然感;

避免單調乏味,作到像人說話同樣的天然,語氣上聽起來積極主動,有意願的感受,每個音素合成的詞句清晰可辨,天然流暢。

人類語音的信息含有語音聲學特徵和文本語義,語音聲學特徵主要是韻律特徵(指音素組合成語句的方式),包括聲調、重音、停頓、語速等,漢語是一種有調語言,聲調攜帶很是重要的情感信息。語音屬於天然交互的一種,它須要達到「天然」的感受,才能讓用戶感知可用。

如何讓Siri聽起來更像人那般天然?

iOS11版本關於Siri的升級目標是「讓Siri聽起來更像人那般天然」,實現方法是經過深度學習,每一種表達都有略微不一樣的聲波,每一句話都包含幾十或者幾百個音素。

Siri爲每一次發聲找出完美的聲音組合,其中音素是由蘋果挑選出的候選人進行發音採集,情感語料的獲取是蘋果以匿名的方式進行收聽,而後用於深度學習進行Siri的訓練。

②一旦肯定「人聲」不宜隨意更改;

一旦人設的聲音已根植在用戶的耳朵裏,不宜隨意更改,若是說手機界面換背景圖就像人換一身新衣裳,而以語音交互爲核心功能的智能產品更換「人聲」,就像從新認識一位陌生人,古語說「如聞其聲,如見其人」,人們會很天然的把聲音與某我的進行關聯,新的聲音是誰,就會從新進行「人物建模」。

③像人和人那樣進行對話;

首先是對話流暢,作到及時反饋,若有停頓,不宜過長。話術簡短而有效,不要主動終止對話,儘量的推進持續交流,固然不能以命令的形式讓用戶去完成某個任務,這不是一個合適的對話,它或許有點像上下級的關係,會致使用戶帶來反感和抵制。

④在感知用戶後嘗試主動發起對話;

再過些時日,可能Amazon Echo它可以根聽說話者的語音情感進行識別計算,經過韻律學特徵(語調、響度、節奏、語音質量等)更懂用戶說這句話的此刻心境,就像電影《Her》裏的那句臺詞「你今天聽起來有點不開心」,它能感知你,試着主動發起一次對話。

相關文章
相關標籤/搜索