俄勒岡州立大學的學者一直在研究,如何讓機器人掌握幽默感,並學會更好地進行脫口秀表演。爲此,團隊帶着脫口秀機器人 Jon 進行了數十場表演,並總結出了一些成功竅門。
在咱們傳統印象中的機器人,大多數是冷酷的金屬質感,即便是 Siri 一類語音助手,雖然沒有實體形象,冷冰冰的聲音也傳遞着一種機器人氣質。app
有句話說,「等到人機交互與人類交流同樣天然時,真正的智能時代就來了。」學習
在人機交互方向上,科學家和工程師們一直在努力,也但願機器人、AI 能夠得到幽默感,以更好地與人類相處,畢竟幽默感,是人類最寶貴的特質之一。人工智能
好比 Siri、微軟小冰,都在努力學習講好(leng)笑話。spa
想讓機器人或者語音助手 AI ,擁有幽默感並不容易,甚至被認爲是領域內的終極難題。blog
(咱們以前已經討論過 AI 擁有幽默感的問題,詳見《讓 人工智能 學會幽默,人機對話不尷尬》。)開發
2019 年 5 月,一個叫作「泰坦」的機器人登上脫口秀節目《笑傲江湖》的舞臺。自稱是來搞笑的它,段子頻出,逗得臺下觀衆鬨堂大笑。rem
可是「泰坦」在動做和語言互動上過於真實的表現,反而引發了觀衆的質疑。而以後也證明,它確實只是一個機器人外殼,裏面藏着一個真人來操控它的動做和表演。get
社交機器人發展至今,它的交互性、對人類情緒的理解,一直以來都十分具備挑戰性,像「泰坦」可能有必定配合節目須要的成分,這樣收放自如、超能接梗的機器人,在現實中還很難作到。it
俄勒岡州立大學有一支研究團隊,從 2011 年開始,就致力於人機交互、機器人幽默感的研究。爲了解決這個難題,讓社交機器人用幽默感更好地吸引人們、更像人類,機器人學助理教授 Naomi Fitter 打算從打造脫口秀機器人入手。class
團隊首先選擇了軟銀機器人開發的 NAO 機器人,做爲載體和表演者,運行他們研發的脫口秀表演程序。
至今,Naomi Fitter 帶着她的脫口秀機器人 Jon 進行了 32 場西海岸巡迴演出,發現了機器人如何逐步理解和學習人類的幽默感。
Naomi Fitter 認爲娛樂機器人技術可以爲科學交流提供好機會
咱們知道,脫口秀通常由「開場白-抖包袱」組成,而除了笑話內容外,講笑話的語速,以及開場白和抖包袱之間的停頓時間,對於脫口秀表演也是相當重要的。
因爲現階段研究方向,是讓機器人與人類的幽默互動更加天然,而不在於笑話自動生成。因此,研究人員遵循脫口秀的通常套路,爲 Jon 預先撰寫了適合機器人的表演素材。
這些素材都是從機器人的角度出發,主題包括人際關係、平常生活、政治、夢想和挫敗感。
好比:最近我侄子問我「機器人來自哪裏」的時候我老是很尷尬,我只能告訴它,機器人來自它的媽媽——快遞的卡車。
Jon 在表演時經過收音判斷現場觀衆的反應,來決定下一個梗是否須要停頓,仍是須要增強語氣。
研究人員撰寫了大約 8 分鐘的素材,包括 26 個笑話,22 個情感標籤。而後使用 NAO 機器人做爲表演者,來運行其喜劇表演的程序。
表演過程當中經過機器人的麥克風來收集表演記錄並評估觀衆的反應
機器人 Jon 在兩個開放麥的表演共 32 場,分別在洛杉磯地區和俄勒岡州兩個開放麥場地進行。
第一項研究:停頓技巧爲表演加分
第一項研究在洛杉磯地區進行,共包括 22 場表演,現場有 10 -20 名成年觀衆,他們以前並未看過機器人脫口秀。
機器人分別進行了兩種模式的表演。
兩種模式流程示意圖
第一種模式爲 bad-timing(不良時機)模式:即講完每一個笑話,固定地等待 5 秒鐘再開始下一個。在該模式下,機器人完成了 12 個笑話;
團隊用基於音量和聲音計數的兩種方法來判斷觀衆是否仍在笑和鼓掌。
而後給機器人設定了 170ms 的基準等待時間,若是觀衆在此期間保持安靜,則會開始,若是一直沒有回覆安靜,則會等到 5 秒超時時開始下一個笑話(專家建議,一般 5 秒就足夠了。)
第二種模式爲 appropriate timing(適當時機)模式:機器人根據現場觀衆的反應來決定暫停或繼續講。若是觀衆在笑,則暫停;觀衆恢復安靜,則繼續。在該模式下,Jon 完成了 10 個笑話。
該項研究代表,若一個機器人喜劇演員的表演時機把握得好,即給觀衆適當的反應時間等,會比沒有把握好時機的機器人自顧自地進行表演要有趣得多。
兩種模式下成功率對比,適當時機模式成功率更高
由於,當一個笑話成功的時候,觀衆常常會笑或鼓掌,但因爲機器人會在固定延遲時間以後就開始下一個笑話,從而使觀衆錯過下一個笑話的一部分,致使失敗。
該圖顯示了,觀衆在講笑話 2 時一直在笑,由於他們還沉浸在笑話 1 中
第二項研究:邊講邊「察言觀色」
第二項研究,是基於俄勒岡州的 10 場表演。團隊將觀衆對於表演的不一樣響應結果考慮進去,稱爲「自適應表演」。
研究團隊給笑話素材中新增了帶有標籤的笑話,標籤分爲激烈,不冷不熱和沉默三種。
自適應表演會根據觀衆不一樣反應選擇不一樣笑話;非自適應表演則單純地「死記硬背」便可
每當機器人講完一個笑話後,根據發出觀衆笑聲水平來選擇哪一種「標籤」的笑話。在第二個研究中,全部的表演都選擇了適當的時機模式(appropriate timing)。
不過,這項研究結果顯示,是否帶標籤,對於表演的成功率影響不大。
結論:適時抖包袱,成功機率高
綜合以上研究,Fitter 總結道:「在壞時機模式(bad-timing mode)下,機器人老是在每一個笑話以後等了整整 5 秒鐘,無論觀衆的反應如何。
而在自適應模式(appropriate-timing mode)下,機器人會使用的時機策略在笑聲想起時暫停,並在笑聲平息後繼續進行,就像一個優秀的人類喜劇演員同樣。
所以總的來講,當笑話在適當的時機講出來時,觀衆的迴應率更高。這個技巧上, Jon 已經比較輕車熟路了。
Fitter 說,這 32 場表演,爲研究團隊提供了足夠的數據,以肯定機器人脫口秀在不一樣模式之間的顯著差別。並且,這些數據能夠幫助「自主社交機器人提升幽默能力」。
同時,這項研究也有助於爲喜劇社交互動的關鍵問題提供一些答案。它將幫助機器人技術和 AI 領域的研究人員,瞭解現實環境中,人類羣體對娛樂化社交機器人的迴應狀況,也將幫助喜劇演員評估一個笑話或套路的成功與否。
在人類演員主導喜劇世界中,機器人是否會帶來變革
好比,下次表演以前,李誕們能夠先讓機器人幫本身彩排一下,若是效果很差,再及時改進。這麼說來,脫口秀演員之後可能不須要上臺表演,只在幕後專一於寫笑話就行了?
就像 Jon 講的一個笑話:若是大家喜歡我,那就預約我吧!我不只會講笑話,還能取代大家的工做 🙂