Yahoo浮沉錄

Yahoo這一路曾經出過不少好技術web

然而,任何人若是隻是把 Yahoo 看成一家缺少聚焦的企業來看也許忽視了公司內部的那些創新—偶爾甚至還有一些很好的產品創意。就拿搜索來講吧,咱們說的不是付費搜索,而是指表明實際搜索結果的藍色連接。Stata 在擔任 CTO 以前曾作了不少年的搜索,他說 Google 曾告訴他,Google 對 Yahoo 相對小的團隊(且人員大都不須要斯坦福的學位)可以跟住 Google,甚至在某些領域挑戰極限是如何的吃驚。算法

大部分工做都是在他 2004 年到 Yahoo 以前完成的,是收購 Inktomi 的成果,但最令他感到自豪的時刻之一發生在他到 Yahoo 以後:Google 中止顯示其索引的 URL 數量的那一刻,由於他宣稱 Google 意識到在這方面本身沒法拉開 Yahoo。跟微軟的交易裏面有一件事是你們都沒注意到的,即 Yahoo 幾乎也跟 Google 也達成了相似的交易,直到政府出面阻止。Stata 認爲,要說 Google 交易有可能的話,其惟一的理由是 Yahoo 對搜索的態度是如此的無情。(他還指出,若是你看看如今 Yahoo 的搜索引擎就會發現,它仍然負責頁面設計以及在側欄展現的全部附加信息)數據庫

早在 2005 年的時候 Yahoo 就試圖要成爲社會化搜索的領導者,所以才收購了 Flickr 和 Delicio.us,併發布了像 Yahoo Answers 那樣的新服務。該公司甚至還考慮過按照用戶的社交網絡來進行搜索結果排名,Stata 說,但最終仍是沒法擺脫內容,由於它歷來都未能產生足夠龐大的社交圖譜來啓動這項排名。(儘管要是 Yahoo 360 不是獨立於搜索團隊而建,而且能利用流行的 Yahoo Messenger 服務的話將會是另外一個故事)網絡

「若是沒有維基百科的話,咱們可能會過得更好,尤爲是 Answers,」他補充說。併發

Yahoo 爲用戶對首頁內容進行個性化的努力至關使人印象深入—至少從理論上來講如此—哪怕是在他們低估了本身的媒體公司心態的狀況下。那時候 Yahoo 已經收集了大量有關用戶的數據,以及 Yahoo 上面哪些類型的文章受歡迎的數據。該公司的搜索專家推斷 Yahoo 能夠經過開發機器學習算法來預測哪些文章會受到哪一類讀者的歡迎,而後定向針對這些來對首頁內容進行自動定製。機器學習

然而,Stata 解釋說,該公司最終不得不選定一種辦法來讓人類編輯及定向算法進行協做,一塊兒來選出 Yahoo 首頁的最佳頁面,而後將其呈現給合適的讀者。有時候,他們會對文章進行簡單的 A/B 測試,而後讓被測試受衆點擊的內容分發到更廣的範圍。工具

「咱們對聖誕節試了 6 種辦法,而後想建立內容分類器,但仍是失敗了,」Stata 說:「……流行的就是流行的(沒有類別之分)。」oop

David Ku 認爲內容優化的隨意性結果是 Yahoo 在搜索方面的相對失敗。內容個性化已經有一些已知的技術,但就像廣告同樣,這些技術有助於瞭解誰在特定時間在找什麼,或者是帶着目的的個性化,如 Facebook 關注於你的朋友那裏流行些什麼遊戲學習

「若是是針對個人話,」Ku 說:「那麼個性化最好要好點。」測試

無論怎樣,一切以Hadoop爲軸心

Yahoo 最成功,也是最出名的的一項技術努力也許要數 Hadoop,正是 Yahoo 幫助培育了這個開源大數據平臺並讓它在 2011 年時成長爲成熟的企業平臺。

Yahoo 投入了成百上千萬美圓(也可能高達數十億)到 Hadoop 的開發當中,然後者也贏得了從定向內容到搜索的 Yahoo「每一個點擊背後」的使能者之榮譽,能夠說基本上是這樣的,至少從這些點擊涉及到分析、定向內容或搜索結果這些方面來講是正確的。Yahoo 是在 2006 年引進 Hadoop 的,爲的是幫助對頁面進行索引,以便能與 Google 在搜索上進行競爭(Hadoop 終於在幾年以後爲搜索提供支撐),但後來它證實本身在 Panama(Yahoo 爲廣告商、內容優化、定向廣告及許多其餘用戶提供的分析工具)的後期迭代升級方面也能提供足夠的支持。

Hadoop 刺激了 Yahoo 基礎設施的若干變化,引導打造富含數據和設計的在線體驗的新方式,Ku 說。在整個公司範圍內,有一個提供內容與分析數據之間的連續循環,從而能爲用戶、廣告商及 Yahoo 帶來更好的結果。

儘管如此,這並不保證獲得普遍採用,由於 Yahoo 的部門之間每每是獨立運做的,對於相同的技術會有不一樣的想法,Stata 說。實際上,他認可,搜索團隊對此跟其餘任何人同樣難逃其咎—在集中精力與 Google 做戰時搜索團隊採起了一種「地堡心態」。Hadoop 是第一個出自搜索並流向各個方向且被認爲有用的東西。

「它的確從技術上幫助將公司凝聚到了一塊兒,」Stata 說。

Usama Fayyad 是在 Hadoop 還沒有徹底在 Yahoo 內部起勢的 2008 年離職的。他認可從某些方面來講 Hadoop 是個救世主,徹底適合於某些工做,但他也指出 Hadoop「肩負的擔子太重」。「Hadoop 幾乎就像是一種宗教信仰,」他說。

在他離開以前,Yahoo 在關係數據庫、NoSQL 數據庫,甚至一種名爲 Everest 的列式數據庫(爲與定向廣告相關的大數據查詢而設計)上投入重金。Yahoo 決定把不少的負載全壓到 Hadoop 身上,這部分是因爲對該技術着迷,部分是由於要通力協做專一於更少的事情上,而他則把 Yahoo 的這種作法視爲是用推土機去推一顆石子。

的確,Bassel Ojjeh 的新公司 nPario 就由於聚焦 Hadoop 的決定而受益,此舉也讓達到產品質量的時間比預期更長了一點。 nPario 利用了 Everest 技術做爲其分析引擎的一部分(如今是在 Hadoop 上面跑 Everest),有一段時間把 Yahoo 看成本身的一個客戶。

當你討論的是這樣一個大規模的系統時,Fayyad 解釋說,它最終會變成一個與技術問題程度至關的業務問題:「維護(Hadoop 集羣)的成本跟計算創造出來的價值相比是否值得?」對於 Yahoo 和許多其餘公司遵循相同路徑的特定負載來講,答案頗有多是否認的。

他暗示 Yahoo 由於 Hadoop 而失去了幾位最好的數據科學家,這些人看到在其餘地方針對更爲合適的技術進行特定計算的機會。(也就是說,Yahoo 的投入可能爲他人利用 Hadoop 技術作了嫁妝)

最後,想讓用戶瀏覽仍須要一個理由

不管是致力於 Hadoop 也好,投入重金到 Panama 上也罷,或者是 Yahoo 那些數不清的收購(包括新任 CEO Marissa Mayer 作出的那些),在公司不能早點認識到本身的處境並致力於門戶之外的任何一件事情的狀況下,討論這些決定是否明智基本上是沒有意義的。不論是作搜索的 Google,仍是後面作社交的 Facebook 等,其餘公司對於消費者會如何使用本身來訪問 web 都有着一個更加清楚的願景,而後成爲了你們優先選擇的接入點。

你須要「某個理由說明爲何你要讓那個服務成爲你生活的一部分,」 David Ku 說。缺少聚焦的 Yahoo 沒有用信息或朋友來勾住你,而是提供(平庸的)服務及內容的融合,最終無法爲吸引用戶使用提供充分的理由。

「Yahoo 沒有把下一代用戶做爲本身的定位,」 Ojjeh 說:「真的,Yahoo 是給我這種年紀的人用的。」

Ku 認爲新任的 CEO Mayer 迄今爲止對於 Yahoo 是有好處的,至少她爲一家一度停滯的公司注入了活力和動力,而且真心想要改善用戶體驗。然而,她仍須要爲公司尋找核心業務(嘿,也許就是媒體也說不定呢!),並找到把它集成進用戶生活中的方法。他指出,微軟和 Google 早已根植到設備的世界裏並利用這些設備做爲消費者接入點了。

不過,即使這些年 Yahoo 誤入歧途且排名已經大幅下挫,但 Mayer 並不是無米下鍋。該公司仍然有一些很是棒的技術、技術人員以及對數據的學院知識。還有着億萬用戶和經過它的各類服務而來的訪客。

「我仍在創業……一切都是白手起家,」 Fayyad 說:「想象一下,要是你給我一個客戶羣而後說,‘OK,Usama,你能夠拿這 700 萬用戶起步。你打算怎麼作?’我會怎麼作?我會告訴你,絕對會讓你大吃一驚。」

[本文編譯自:gigaom.com]

相關文章
相關標籤/搜索