人工智能助理Alexa仍是有真人在聽？傳有大量員工辨識分析數百萬條語音

時間 2019-12-05

標籤人工智能助理 alexa 仍是真人大量員工辨識分析數百萬條語音简体版

原文原文鏈接

亞馬遜（Amazon）人工智能助理 Alexa 應用大量數據訓練，以提高語音識別和應答的準確性，但亞馬遜從未透露提高 Alexa 準確性的細節，據 Bloomberg 報導亞馬遜在訓練 Alexa 時，有大量員工辨識分析數百萬條語音，因爲人類加入，語音助理提供服務的過程，就會面臨如何保護用戶隱私的問題，至今亞馬遜沒有給更好的解釋。機器學習

語音助理訓練會使用大量數據，亞馬遜宣佈時，每每會介紹大量機器學習技術的應用如何提高語音助理的性能，但提高辨識準確率最高效的辦法就是讓人來聽。這一點在亞馬遜 Alexa 冗長的用戶服務協議中列明，但不多會有 sbf勝博網用戶注意到這些內容。隨着語音助理在平常生活的應用愈來愈廣泛，用戶也開始關注語音助理如何工做，但各大公司對語音助理的服務和技術細節每每避而不談，特別是有員工參與語音識別這些細節從未公開討論。

機器學習技術應用時，人類參與數據的分析一般解釋爲數據註釋，這是天然語言辨識、翻譯、圖像辨識等技術應用的基礎工做之一，好比 Alexa 沒法準確辨識用戶的口音，不一樣地區重複的地名或其餘難以辨識的信息，技術研發時並無考慮到這些因素，應用就須要人類介入修正。性能

在全球有成千上萬亞馬遜公司、供貨商和合做方員工參與 Alexa 語音助理的工做，從技術層面來看，半監督學習的模式是提高機器學習技術效率的主要方式，但問題在於大多數用戶並不知道本身的語音可能被另外一我的聽到，同時語音可能包括用戶的隱私數據，且這些數據可能被人爲濫用，整個過程都得不到有效監管。學習

據 Bloomberg 報告顯示，當員工從 Alexa 語音助理聽到一些負面內容，一旦涉及執法機構調查，亞馬遜有可能提出這些語音數據，以前有案例 Alexa 語音當成庭審證據，更糟糕的是 Alaxa 部分員工會與其餘同事分享、討論聽到語音的有趣或尷尬的內容，此舉涉嫌侵犯用戶隱私。人工智能

亞馬遜聲明，人爲介入只爲幫助一小部分 Alexa 語音，以便改善用戶體驗，這有助於提高語音識別的準確率和升級天然語音理解系統，Alexa 才能爲用戶服務，但執行過程有嚴格的技術和操控限制，對任何濫用 Alexa 數據的行爲都是零容忍，員工沒法得到語音發出者的用戶數據，任何涉及我的隱私的資料都是保密的。翻譯

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。