本文由 [AI前線]原創,ID:ai-front,原文連接:t.cn/ROfPoY5算法
去年某一天,當我正在玩一款名爲《冤罪殺機 2》的電子遊戲時,我在YouTube上常規搜索了一下,看看這個遊戲中一個棘手的部分怎麼通關。像往常同樣,我找到了回答我這個問題的一個視頻。但當我下次打開YouTube的時候,網站卻給我推薦了更多更復雜的關於如何玩這個遊戲的視頻:玩家如何玩這個遊戲而不被敵人發現的視頻剪輯;玩家用高超的方法殺死每個敵人的視頻剪輯;採訪遊戲製做者的視頻;精彩絕倫的諷刺評論。我只是去YouTube搜索一個問題的答案,它卻像我展現了一個全新的宇宙。服務器
後來,我發現本身天天都會訪問YouTube好幾回。大多數時候,我打開這個網站都沒有什麼特別的目的,我已經習慣了被動地讓網站自動給我推薦點什麼我可能喜歡的東西。一月份的時候,我開始癡迷於一個叫Pinegrove的民謠樂隊,幾個禮拜的時間裏,YouTube給我推薦了幾乎全部上傳到它服務器的這個樂隊的現場演出視頻。當我春天住進一個新公寓的時候,開始愈來愈多地作飯,在我搜索了一次如何作意大利麪包沙拉以後,YouTube很快就讓我認識了它的家庭主廚陣營:Byron Talbott、Serious Eats頻道的J. Kenji López-Alt,以及Tasty等等。機器學習
YouTube老是頗有用,它從2005年創辦以來,就成了互聯網的支柱之一。但在過去的幾年裏,對我來講,YouTube變得出奇地棒。它開始極端準確地預測出我可能感興趣的視頻剪輯是什麼,比它過去所作的要強得多。究竟是什麼發生了改變?工具
在過去的12年時間裏,YouTube已經把本身從一個搜索驅動的網站轉變成了一個爲本身目的服務的網站。要到達本身的目的地,它須要成百上千種嘗試、大量的從新設計,以及在人工智能方面的巨大飛躍。但真正讓YouTube提高的仍是它朝Feed的方向進化。學習
如今想起來很難記得了,但最開始,YouTube只是一個基礎設施。它提供了一種方便地把視頻植入其餘網站的方法,經過這種方法,你最有可能看到這些視頻。隨着網站壯大,YouTube成了一個尋找過時電視節目剪輯的地方,它會隨時跟進最新的午夜喜劇,用來觀看最近的病毒式傳播視頻。和維基百科同樣,YouTube或許也是互聯網上最臭名昭著的地方。你的同事在茶水間提了一句Harlem Shake搞笑視頻,而後你就登陸YouTube看了一夜。網站
同時,Facebook發明了咱們這個時代的標準格式:News Feed,一種根據你的興趣定製的永不間斷的信息流。Feed佔領了整個消費者互聯網,從Tumblr到Twitter、Instagram和LinkedIn。YouTube早期像我的定製化的發展頗有限,它主要是讓用戶去訂閱頻道。這個主意是從電視那裏借用的,它擁有混雜的複雜結果。根據ComScore的數據,在2011年,YouTube一次大規模的推送取得了一些成功,但人均觀看YouTube視頻的時間卻和以前持平。人工智能
「頻道」已經不能像以往同樣主宰YouTube了。如今,打開你手機上的YouTube,你會發現「頻道」被隱藏在了一個單獨的菜單裏。取而代之,這個應用會根據你的興趣量身定製一些混合的視頻,並以Feed的形式呈現給你。這些視頻中固然也有你訂閱過的頻道的視頻,但其中也包括和你之前看過的視頻相關的視頻。設計
這就是爲何,當直接搜索了關於《冤罪殺機》視頻以後,我就開始看那些推薦的通關視頻和刻薄評論。YouTube開發了各類工具,讓它的推薦不只是我的定製化的,仍是高度準確的,這些就最終提高了整個網站的觀看時間。cdn
YouTube推薦的技術帶頭人Jim McFadden說:「咱們知道,人們來YouTube是來找他們想要的東西,但咱們還但願,在人們不知道他們想要找什麼的時候,一樣知足他們的需求。」McFadden從2011年就加入了這家公司。視頻
我第一次拜訪YouTube也是在2011年,就在McFadden加入這家公司幾個月以後。就是那時候,YouTube開始讓用戶花更多時間來看它們的視頻,如今,這也依然是YouTube的核心目標。在那個時候,事情還進展得並非很是順利。McFadden說:「YouTube.com做爲一個主頁,它並無帶來大量的娛樂性。咱們就想,好吧,那咱們就把讓它具有大量娛樂性做爲轉型目的。」
這家公司什麼事情都嘗試了一下:它爲頂級的創做者購買了專業的攝像設備,發起了「leanback」功能,它能夠在你觀看視頻的時候,自動排列新的視頻給你。YouTube從新設計了它的主頁,以此強調訂閱頻道,而不是看單獨的視頻。
每一個用戶觀看的時長依然持平,但有一個變化出現了,那就是它們的推薦算法並不是基於有多少人點擊了視頻,而是基於人們花了多長時間來觀看這些視頻,正是這個變化驅動了接下來那個春天發生的劇變。
幾乎是一晚上之間,那些受益於誤導性標題和視頻略縮圖的視頻創做者就看到他們的觀看數字急轉直下。質量較高的視頻每每和更長的觀看時間相關,它們開始急劇上漲。在接下來的三年裏,YouTube的觀看時長每一年都增加了50%。
我訂閱了一些頻道,而且自認爲是個YouTube的普通用戶。可是它要成爲一個一天內屢次訪問的目的地,還須要一系列的新工具,那些在過去18個月內成爲可能的工具。
當我這個月拜訪YouTube辦公室的實話,McFadden向我介紹了YouTube精確推薦視頻的根源:Google Brain,它是YouTube的母公司Google的人工智能部門,YouTube從2015年開始使用它。Google Brain並非YouTube第一次嘗試使用AI,YouTube此前曾把Google創建的Sibyl系統中的機器學習技術應用到推薦算法中。然而,Google Brain引入了一種見無監督學習的技術,它的算法能在不一樣的輸入中尋找到聯繫,這是軟件工程師們從不曾想過的。
McFadden說:「最關鍵的一點是它可以普及推廣,在此以前,若是我看了一個喜劇的視頻,推薦算法會說,又有一我的喜歡了這個視頻。可是Google Brain的模型會識別出相似於此的其餘喜劇,但又不是徹底相同,它們擁有更毗鄰的關係。它可以識別出不那麼明顯但類似的模式。」
舉個例子,一個Google Brain算法會給一個移動應用用戶推薦短小的視頻,但給YouTube TV的用戶推薦長一些的視頻。它猜想,根據平臺的不一樣推薦不一樣長度的視頻會最終提高觀看時長,它是正確的。YouTube在2016年實施了190多個相似這樣的改變,而今年計劃要作出300個改變。YouTube發現小組的產品經理Todd Beaupre說:「現實就是,它是隨時間推移累積起來的一大批微小的改進。對每個改進來講,你都要嘗試10件事最終實施一件事。」
Google Brain的算法比YouTube以前的算法要更快。公司表示,在過去的幾年裏,一個用戶行爲要通過好幾天纔會被整合進將來的視頻推薦中,這樣就很難識別出趨勢。Beaupre說:「若是咱們但願把用戶吸引過來了解當下在發生什麼,咱們就必須修補這個問題,如今,延遲被設定在幾分鐘或幾小時的時間裏,而不是幾天。」
把Google Brain整合到YouTube中有一個重要的影響:人們在YouTube上看視頻的時間,如今有超過70%都來自YouTube的推薦算法。每一天,YouTube會推薦兩億個不一樣的視頻給用戶,涉及語言有76種。和三年前相比,人們在YouTube主頁上看視頻的總時長增加了20倍。
這也基本上和我我的的用戶行爲相符合。幾年前,我基本上一般只在午餐休息的時候訪問YouTube主頁,一邊吃飯一邊看點什麼。但他們的推薦實在太好了,我開始用更多的空閒時間看視頻。這禮拜,我在PS 4上登陸了YouTube,這樣我就能用我最大的屏幕來看它推薦的視頻了。
這就是一個真正強大的我的定製化Feed。對我來講,使人驚訝的是,YouTube對我數字生活的改變比其餘任何東西都要強大。Facebook的Feed是基於你的朋友們發了什麼東西,還有你喜歡的主頁發了什麼內容。知道誰訂婚了或者生小孩了頗有用處,但除了這些里程碑意義的事件外,我從朋友們發表的內容中沒找到什麼樂趣。Twitter會給你看你關注的人們的推文,還有這些人選擇轉發的東西。做爲一個記者,我必須依賴於Twitter,即便有些時候個人時間線真是看似沒有盡頭,充滿了焦慮的吶喊。
每個Feed都有長度限制,雖然2017年取消了這個限制。在Twitter上,無論你關注誰,關於政治的爭論永遠主宰者討論。Facebook對於「事件」和「團體」這些功能的短暫熱情讓Feed每週都以使人震驚的方式發生變化,這讓我感受和每個朋友的鏈接都更少了。(以圖片爲重的Instagram看起來就像一片綠洲,也難怪這個應用還在如此迅速地增加。)
Facebook、Twitter和Instagram,看起來那些Feed都要求人們不斷地爲它們表演點什麼。而YouTube很顯然是表演驅動的,但不多一部分用戶會給它上傳視頻,並且YouTube也歷來沒有強迫用戶去上傳。YouTube能夠被人們被動地享受着,就像它那麼努力地去嘗試取代的電視頻道所作的同樣。在咱們這樣一個瘋狂的年代,能不被詢問咱們對某個新聞的見解,這真是讓人感到平靜啊。
YouTube對你可能喜歡的相關視頻的強調,意味着它的Feed和其餘Feed相比更寬廣,更具備好奇心。它越是尋求不一樣的內容,就越讓人以爲它在逃離其餘Feed的模式。在一個黑暗的時代,我更傾向於選擇YouTube的逃避主義。
在2013年,《大西洋月刊》上有一篇文章,在那篇文章裏,Alexis Madrigal假設咱們所知的Feed有其頂峯。他認爲,將來會屬於有限的經歷:電子郵件的newsletter、Medium的合集、10集長度的Netflix劇集。畢竟,無窮無盡的信息流內容讓人感到疲憊。Madrigal說:「當媒體宇宙的秩序被完全擊敗,自由並不會來填補空白,擁有其自身邏輯的新興秩序將會取代舊的秩序。咱們發現信息流已經展示出它的強迫性和控制性。更快!更多!更快!更多!更快!更多!」
從那四年以後,YouTube的方向只說明瞭Feed模式在變得更重要。一種史無前例的視頻存儲增加,輔之前所未有的我的化定製技術,將會創造出讓人難以拒絕的東西。YouTube如今會調查用戶有多喜好它們推薦的視頻,久而久之,調查的結果會讓YouTube更加智能,從而讓更多視頻內容被消費。
Beaupre向我描述了這個過程,說它就像跨越一條鴻溝那樣。「有些內容和你已經喜歡的內容有高度的契合,而有些內容會表明着趨勢和流行的內容,而在這二者之間,就是充滿魔力的地帶。」若是YouTube的競爭對手找不到跨越這條鴻溝的方式,它們就會發現競爭舉步維艱。
做者|Casey Newton
譯者 | NER
編輯|Emily
AI前線面向AI愛好者、開發者和科學家,提供最新最全AI領域技術資訊、一線業界實踐案例、蒐羅整理業界技術分享乾貨、最新AI論文解讀。每週一節技術分享公開課,助力你全面擁抱人工智能技術。