前幾天的3.15晚會上曝光了利用智能機器人,一天打4萬個騷擾電話,從而賺取利潤的黑色產業鏈。程序員
阿里的工程師惱了,技術是用來讓人們生活變美好的,不是被利用來走向陰暗的。算法
機器人的問題交給機器人!網絡
工程師們用業餘時間開發的AI機器人——「二哈」要登場了~框架
視頻感覺一下我們「二哈」,連女推銷員都絲毫沒有察覺。學習
研發「二哈」,其實就是阿里的技術人,對日益廣泛的騷擾電話很頭疼,並且更可氣的是,大量騷擾電話是機器自動撥出的,成本愈來愈低。測試
這些騷擾電話,甚至還影響到平常工做,會議開着開着,常常被各種電話打斷致使會議終中斷。因而阿里AI實驗室的同窗們開始思考着如何用技術的方式解決問題。spa
阿里AI實驗室天貓精靈算法團隊,彙集着語音識別、NLP、知識圖譜……全鏈條的技術人才,當技術人聚在一塊兒,那就能搞事情了。視頻
因而他們先以「課餘」項目開始,參與的同窗都很開心。一方面是解氣,另外一方面更清楚背後帶來的意義。blog
沒想到在今年3.15晚會上,機器人騷擾電話引發如此大關注。支付寶
因而團隊決定公開最新研發成果,「二哈」也正式從幕後走到臺前,一炮而紅。
「二哈」是這個智能防騷擾電話技術的項目代號。當用戶在手機上開通了這項服務,在接到騷擾來電時,用戶能夠直接轉接給機器人接聽。
咱們都知道哈士奇之因此被喊做「二哈」,就是它歡樂多,工做起來又至關認真。阿里的程序員們,就是但願這個「課餘」愛好的項目,給本身帶來快樂,也能幫主人掃除騷擾電話的焦慮。
而「二哈」背後,其實主要使用了智能聊天技術。
所謂「智能聊天」,就是要理解用戶請求,同時用強大的知識圖譜製做聊天的知識點,經過跟用戶對話,把知識圖譜裏的知識灌輸給用戶,同時也引導用戶反饋。
聽起來,簡單的一段話,要真正實現聊天聊得「真假難辨」卻十分不容易。
因而,咱們特意請教了阿里達摩院AI實驗室語音助手首席科學家聶再清。
他告訴你們,要作到真假難辨,最核心的是如下3點:
第一,接住用戶的每一句話。
由於用戶的輸入空間很是大,要理解和聰明的回覆來電者的每一句話頗有難度。
對於一些不是「二哈」知識領域的問題,阿里AI目前採用了閒聊(ChitChat)的技術,從互聯網上公開的人類對話庫中來找到最適合回覆。目標是讓來電者看不出「二哈」可能的知識缺少。
第二,主動提出一個相關問題。
這更可能是一個對話策略學習的工做,須要讓來電者知道「二哈」真能理解他們的話,並提出只有理解了對話上下文,才能提出的好問題。
一味被動接話,很容易被識破。
該項挑戰很是大,核心就是一套聊天機器人對話策略學習框架,讓「二哈」這樣的聊天機器人在不一樣的場景下均可以持續學習。
經過和人類不斷對話,「二哈」AI會經過深度強化學習愈來愈好地知道如何提問才能更好地達成他的目標。
若是推銷廣告的騷擾電話,經過聲音判斷初接電話的是個機器人,他們就不會繼續聊下去了。
因此「二哈」在語音合成方面作了不少工做。
阿里AI最新算法利用Tacotron加上基於神經網絡的聲碼器算法,合成出極其逼真的人聲,但還有很大比例狀況不能經過圖靈測試。因而「二哈」如今採起了過渡性方案,把很是高頻的回覆借用真人錄播。
感覺一下「二哈」真聲和「二哈」的互相調戲學習,居然沒有一點違和感呢。
「二哈」就只是幫對付騷擾電話而已嘛?
固然不是咯。
項目組的工程師說,「二哈」的進一步的目標是成爲每一個人的AI電話祕書,除了幫主人應付騷擾電話,還能夠在主人繁忙的時候詢問來電的主要意圖,也能幫主人預定議程。
在你不方便接電話時幫接聽來電,並轉換成文字向你「彙報」。
「二哈」這樣的AI電話祕書,能夠利用個性化TTS,模仿出跟主人聲音極盡逼真的聲音。能夠把它看做是你的‘聲替’,也能夠用任何喜歡的聲音替你接打電話。
阿里工程師還在暢想,是否有一天,它還還能夠幫助聾啞人打電話?技術的進步能夠延伸人的能力,也能夠彌補人的缺陷。
阿里人常說,全部的異想天開,終究化爲尋常。但願這樣的「尋常」能早點到來!
講真,這樣的私人祕書,你期不期待?
最後告訴你一個小技能:在支付寶搜索天貓精靈,或直接打開天貓精靈App,就能夠調戲這隻二哈!
本文來自雲棲社區合做夥伴「 阿里味兒」,如需轉載請聯繫原做者。