本文由 「AI前線」原創,原文連接: Google給AI出了UX設計指南
策劃編輯|Natalie
做者|Josh Lovejoy
編譯|Debra,薛命燈
AI 前線導讀:」AI 的做用不該該只是大海撈針,而是幫助咱們撥開雲霧,讓咱們本身去發現明月。經過 Google 的 AI 產品 Google Clips,讓咱們來看看以人爲本的設計是如何讓 AI 上升到另外一個高度的。」面試
就像移動革命以及以前的互聯網同樣,機器學習讓咱們從新思考、構思並考慮咱們過去所得到經驗還有多少可能性。在 Google UX 社區中,咱們開啓了一項名爲「以人爲中心的機器學習」項目,以引導關於這個話題的討論和關注。透過鏡頭,咱們來看看機器學習(ML)產品如何用獨特的方式解決人類的需求。這個項目是 Google 團隊的成果,旨在讓 UXers 們瞭解核心 ML 的概念,以及如何用最佳的方式將 ML 整合到 UX 工具帶中,並確保以包容的方式構建 ML 和 AI。算法
Google Clips 相機捕捉的父母、孩子和寵物的真實場景架構
Google Clips 是一款智能相機,設計的初衷是用來捕捉用戶熟悉的人和寵物最真實的時刻。這款相機可以徹底憑藉設備上的機器智能,專一於學習和你在一塊兒度過期光的人或寵物,並可以理解怎樣拍出漂亮和使人難忘的照片。以 Google Clips 做爲案例,咱們將回顧三年來這款產品從在設備上建模、工業設計到用戶界面創建過程當中的核心要點, 以及在 AI 驅動產品實踐中以人爲本的設計理念。框架
使用 Google Clips 能夠選擇完美的框架(上圖左側),並保存爲一張靜止圖像(上圖右側)。在這個例子中,我把相機夾在籃筐上,捕捉我兒子投籃的瞬間機器學習
若是不符合人的需求,即便系統功能再強大,也僅能解決小問題,或者根本解決不了問題。工具
僅僅讓更多的 UXers 使用 ML 產品是不夠的。讓他們瞭解某些核心 ML 的概念,理解 AI 及其功能的理念,以最好的性能來構建和維護用戶的信任是相當重要的。性能
從肯定哪些模型對構建有用,到數據收集、註釋、新型原型和測試,ML 生命週期中的每個階段都是創新的時機。學習
如下是爲何咱們認爲採用以人爲本的理念來構建由 ML 驅動的產品和系統很是重要:測試
三種以人爲中心的設計理念讓 AI 更上一層樓大數據
解決人類真正的需求今年,人們將拍攝大約一萬億張照片,這對咱們大多數人來講,它們只是一個不會再去翻閱的照片庫而已。新生兒父母尤爲如此,他們的生活充滿了人生中的第一次。在那些值得記念的珍貴時刻,用戶會選擇拿出他們的手機捕捉下這些美好的瞬間。結果,這樣致使他們每每只能經過一方小小的屏幕來觀看這個世界,而不是用他們全部的感官進行互動。
做爲一個新的父母,你的圖庫可能看起來和個人同樣,爲了抓拍到完美可愛的表情而進行連續拍攝。
若是咱們可以設計一款產品,可以幫助咱們記錄下咱們關心的人的每一個瞬間呢?如何咱們能夠出如今照片中,而不是老是在照相機以後呢?若是咱們可以及時拍攝下照片,而沒必要因必須停下來,拿出電話,打開相機,打開鏡頭而破壞了興致?並且,若是咱們可以讓攝影師在咱們身邊捕捉到更多真實的生活時刻,好比個人孩子真實的微笑,應該怎麼辦?這就是咱們要解決的問題。
爲信息作引導
當咱們開始這項工做的時候,最迫切須要解決的問題是:若是人們拍攝了大量的照片,但實際上並不想回頭去管理它們,那麼咱們將如何標註這些照片呢?這催生了基礎的「HCML exercise」:描述理論上的人類「專家」今天可能執行的任務。這個理論包括兩層含義:首先,人類完不成的任務 AI 也不可能完成;其次,經過深刻研究專家的方法,咱們能夠找到引導信號的數據收集、標籤和模型架構。
人類沒法完成的任務,AI 也沒法完成。
我能想到與此最貼近的例子就是婚禮攝影師,因此我開始用一個很是模糊的招聘信息成功誘惑一名紀錄片製做人,一名攝影記者和一名美術攝影師來面試並簽了合同,組成團隊來回答這個問題:讓人難忘的時刻是什麼樣的?
在評估咱們的照片和視頻的質量時,咱們必須認識到被咱們當作理所固然的細微差異、審美本能和我的經歷是很是重要的。例如,每當我看到個人小兒子在折騰一個彎折的吸管(最左),或者躲開我不讓我親他的臉頰(中間),我就會感到有點崩潰。當我看到個人大兒子在公園裏騎自行車的時候,我很是自豪,由於我記得那一天他終於敢本身騎自行車了。
創建信任
咱們這項工做的出發點,是假設咱們能夠向模型輸入咱們認爲漂亮而有趣的素材,並且它知道如何找到更多相似的東西。咱們曾經談過關於景深、三分法則、戲劇性照明、講故事等話題,但我從中學到一點,就是永遠不能低估人類運用常識的能力。
這些早期的實驗暴露了技術和方法上的鴻溝,這些差距幫助咱們從新評估了這款產品能夠實現的目標,以及這項工做的性質。咱們把範式從將 ML 放在顯要地位,轉變爲了解到只有在至關簡化的框架下才能有效地學習。基本上,咱們正在經過閱讀莎士比亞而不是 Go、Dog.Go! 來教兩歲小孩英語。這就是 AI 這個「龐然大物」的神話對我來講最難對付的地方,即世界上存在一種能夠理解全部事物,並能夠根據知識進行上下文理解的」智能「這種想法。不可能,這離實現還差得很遠。
迴歸本源
一致性在全部知識教授過程當中都很重要。這就是爲何咱們在教孩子閱讀和說英語時,儘量花較長時間讓他們理解 O-U-G-H(例如 tough, through, thorough)。與"at"的發音聯繫起來之後,他們就會理解 cat、 bat 和 sat 等單詞發音的一致性。
然而,算法不會提供這樣的反饋。就算法而言,除非另有指示,不然所顯示的全部內容都具備相同的價值。對於 Clips,這意味着每一個示例之間都須要具備一致性。每個單獨的框架都須要表明咱們正在試圖教授的具體預測,並且每每能夠教會它須要忽略什麼。
捕捉
咱們須要針對如下幾種場景來訓練模型:手擋住鏡頭、快速移動、模糊強度。
咱們以上面的場景做爲例子來訓練模型,左邊是相機放在口袋或手袋裏的場景,右邊是手指或手掌擋住了部分鏡頭的場景。咱們沒法立竿見影地將模型訓練到可以忽略掉某些內容,但從長遠來看,這是咱們整個設計的重要組成部分。排除掉無需處理的內容,就能捕捉到更高質量的視頻短片。
構圖
咱們還要針對穩定性、銳度和取景構圖來訓練模型。人臉識別模型很容易把處於取景框邊緣的人臉與取景框中間的人臉同等對待。
要想讓模型保持被攝主體的連續性,須要讓主體突出。左上是個人小兒子一直處於取景框中,右上是個人大兒子只有一半時間處在取景框內。
社交基準(social norms)
親密度是攝影的基礎之一。你把相機對準某人,他們作出表情或擺出姿式,默許你的拍攝,並且你正是經過取景器進行取景構圖的那我的。而若是使用的是自動相機,那麼就須要根據社交線索來判斷被攝主體的親密度,好比你與他們在一塊兒相處時間的長短、他們是否常常出如今相機的取景框內。
編輯
在拍攝照片時,多拍幾張是件理所固然的事,也就是要保持多元性。咱們會以爲已經拍得夠多了,但在訓練模型時確實須要大量的照片。
咱們會從三個維度考慮多元性:
我把 Clips 放在書架上,從上向下拍攝我兒子的活動。相機在很長一段時間內拍攝到的都是類似的內容。要想避免太多沒必要要的冗餘但又想不錯失重要瞬間,這對於 UX 來講是個不小的挑戰。
信任度和自我效驗
咱們在 Clips 上投入,並非由於它具有多麼強大的功能,而是由於它可以在設備上進行不外泄隱私的機器學習。相機屬於我的物品,咱們不遺餘力來保證設備和內容最終都只屬於用戶本身。沒有徵得用戶的贊成,全部的東西都只會呆在設備上。
概念設計
在考慮信任度和自我效驗的同時,咱們也在考慮如何作好 UI 設計。在剛啓動項目的時候,咱們只能自做假設一個 AI 產品應該是什麼樣子的。
在參考將來科技風格的設計時,不少設計師會想到電影《少數派報告》(Minority Report)和《銀翼殺手》(Blade Runner)。但若是真的要像《少數派報告》電影裏那樣向用戶展現 UI,看起來真的很瘋狂:伸開你的手臂,等上兩秒鐘,抓一把空氣,反方向轉動手掌並向右甩。就是這麼簡單!幾乎全部的科幻 UI 都很類似,彷佛交互模型必定要與它所在的系統保持步調一致。在設計的早期階段,咱們也是這麼想的,但後來咱們基於如下幾點緣由仍是放棄了這種想法:
大部分產品都有必定的學習曲線,而有了 AI 的加入,就更要注重瞭解用戶的認知。若是用戶對產品感到新奇(圖 A),那麼就着重強調其信任度。若是用戶須要學習使用大量的 UI 元素(圖 B),那麼就確保用戶可以掌握主要的使用場景。若是產品的功能高度動態化(圖 C),那麼就須要應用用戶熟悉的模式。
咱們開始瘋狂地下降 UI 的複雜度,將可控性和熟悉度做爲體驗框架的基礎。咱們在相機上增長了一個軟件取景器和一個物理捕捉按鍵。咱們要確保用戶可以本身決定拍攝內容的好壞,從視頻短片裏的靜止幀到其中的某一段內容。咱們儘量多地向用戶展現拍攝內容,他們能夠選擇刪除不想要的,這樣他們就可以更好地瞭解相機想要捕捉什麼,並相信相機在之後可以拍攝到想要的畫面。
硬件、智能和內容只屬於你本身
在測試 AI 產品的過程當中,咱們有一個重大的發現:在真正成功以前先僞裝成功。若是必定要作出選擇,那麼使用用戶真實內容來建立 UX 原型要比使用真實的機器學習模型要有用得多。後者須要更長的時間,而前者可以讓你瞭解用戶對產品的期待。
用戶在設備上瀏覽視頻短片。左邊,用戶選擇他們想要的短片,並保存到手機上。中間,用戶能夠打開「推薦」模式。右邊,用戶能夠選擇靜止幀並保存成圖片。
從主觀性和我的定製化方面來看,咱們作不到完美,這不該該成爲咱們的主要目標。與傳統的軟件開發不同,機器學習系統是作不到無 bug 的,由於預測分析自己就是一門帶有不肯定性的科學。但也正是由於不肯定性,機器學習才變得如此有用。Clips 的目標不只僅是要實現視頻的保留、刪除、點擊和編輯(儘管它們確實也很重要),它更關注原創、共同窗習和改編。
有意圖的設計
傳統的 AI 是要讓機器變得更聰明,而若是咱們是以加強人類的能力爲目的,那麼就有可能釋放出機器學習更多的潛能。機器學習將成爲前所未有的創新工具,幫助咱們認識存在於咱們自身和世界之中的模式。咱們有望經過 AI 來塑造一個更加人性化的世界,固然,咱們會時刻記住根植於心中的理念:找出和解決人類真正的需求,增長人類的價值,爲了加強而不是自動化而設計。
AI 的做用不該該只是大海撈針,而是幫助咱們撥開雲霧,讓咱們本身去發現明月。
原文連接:
更多幹貨內容,可關注AI前線,ID:ai-front,後臺回覆「AI」、「TF」、「大數據」可得到《AI前線》系列PDF迷你書和技能圖譜。