目前,Pinterest月平均活躍用戶量達到1億,這家以圖片爲主的公司是如何留住用戶並盈利的呢?Pinterest的主要目標是向用戶推薦相關的圖片或內容,推薦的內容足夠精確才能提升用戶黏性。近期,《快公司》發文表示,Pinterest 正從機器學習切入,向用戶推薦更精準的內容,並拓展新的在線業務。算法
在Pinterest 平臺上,人們能夠搜索、下載全網範圍內的圖片和文章,找到與本身喜愛契合的內容天然可以增長他們的用戶忠誠度。Pinterest 推薦的相關內容提升了30% 的參與度和 25% 的購買度。這些精準推薦都是依託尖端的數據驅動技術和大量實驗的結果。數據庫
用戶能夠經過Pinterest 臺的虛擬釘板收藏全網範圍的在線商品、帖子、圖片,就是說這個平臺徹底是基於用戶興趣偏好創建的。Pinterest 無需像其餘社交網絡同樣,根據用戶的點擊模式或者特定頁面停留時間來猜想其興趣。這也意味着它的算法能推測到 750億個收藏的內容數據庫中相互關聯的信息,由於類似的內容更容易被固定在同一個釘板上,從而輕易識別用戶偏好。網絡
Pinterest 能夠說是一個社交圖,由數十億相互聯繫的用戶、被不一樣用戶收藏的同一個項目、收藏相似項目的虛擬釘板三部分構成,這樣的組成結構同時決定了其用戶量將會不斷增加。機器學習
Pinterest 的高級發現科學工程師 Mohammad Shahangian 說,「咱們經過數百次的實驗對咱們的算法作出微小修正,肯定發現問題的方向「。簡單地根據用戶關注人羣決定爲其推薦內容的模型是不理想的,假設一個用戶正在策劃本身的婚禮,她的虛擬釘板添加了不少禮服款式的圖片,而她的關注者並不必定須要這類服飾,爲他們推薦禮服可能形成無心義的重複。而 Pinterest 全部的數據可讓 Pinterest 的用戶得到 。工具
Shahangian 表示,「 若是你的虛擬釘板收藏了一個廚房水槽的連接,咱們是否須要向你推送一萬多款廚房水槽,或啓發你怎麼能總體設計你的廚房呢?」 爲了在這樣的狀況下作出正確判斷,該公司的工程師們測試了多種機器學習算法,來研究不一樣公式如何執行對類似或不一樣的測試集的收藏,以及他們最終如何影響現實世界的用戶的參與度。學習
然而,事實上,Pinterest 的技術研發缺少實例測試,研究員沒法經過給某個特定的用戶付錢來測試他是否會接受一組新的推薦。雖而後面的測試過程沒法進行,目前的算法已經基本能夠實現經過用戶的收藏內容來斷定此人是否願意擔任人工測試者。Pintesrest 從自身的一路發展中收穫了很多啓發,個性化一直是提升用戶參與度最大的影響因素之一。與此同時,該公司也一直致力於提升視覺搜索功能,幫助用戶獲取與目標圖片類似的內容。 今年早些時候,Pinterest 的工程師們與來自伯克利加利福尼亞大學視覺與學習中心的研究人員一塊兒開發了可自動檢測圖像內容的深度學習技術。測試
Pinterest 的高級視覺搜索工程師 Dmitry Kislyuk 說,當咱們試圖去分辯圖片內容是一隻貓仍是一條狗時,這並不算一個分類任務,關鍵在於保證明時性的前提下尋找圖像之間的視覺類似性。可視化搜索工具尤爲適合收集家居裝飾和時尚類商品的信息。將來,公司但願提升將目標內容映射到其類別的能力,舉例來說,當用戶想找同一種食材的新食譜時,就不要只提供這種食材的相似照片。spa
高級視覺搜索工程師 Andrew Zhai 指出, 「我認爲咱們的模型能夠更語義化,有效地將深度學習應用於映射更加概念化的圖像。與此同時,Pinterest 的的工程師們正在專一於完善目標的檢測和搜索開發一款應用程序,讓智能手機用戶經過給現實世界中需求物品拍照,上傳到平臺後,獲得相關的推薦。設計