重磅 | 阿里巴巴年度技術總結:人工智能在搜索的應用和實踐

本文由 【AI前線】原創:t.cn/RHxv3Hp算法


做者|歐文武               編輯|Emily性能優化

AI 前線導讀:"以深度學習爲表明的人工智能在圖像、語音和 NLP 領域帶來了突破性的進展,在信息檢索和個性化領域近幾年也有很多公開文獻,好比 wide & deep 實現了深度模型和淺層模型的結合,dssm 用於計算語義相關性,deepfm 增長了特徵組合的能力,deep CF 用深度學習實現協同過濾,rnn recommender 採用行爲序列預估實現個性化推薦等。工業級的信息檢索或個性化系統是一個複雜的系統工程,深度學習的工業級應用須要具有三個條件:強大的系統計算能力,優秀的模型設計能力和合適的應用場景,咱們梳理了過去一年多搜索在深度學習方向上的探索,概要的介紹了咱們在深度學習系統、深度學習算法和搜索應用落地的進展和思考,但願對你們有所啓發。"網絡


深度學習在搜索的應用歸納起來包括 4 個方面:框架

首先是系統,強大的深度學習訓練平臺和在線預測系統是深度學習應用的必要條件,目前咱們的離線深度學習框架、在線深度學習框架和在線預測框架統一到 tf,並實現了日誌處理,特徵抽取,模型訓練和在線服務部署端到端的流程,極大提高了算法迭代效率;dom

其次是搜索應用,包括智能交互,語義搜索,智能匹配和智能決策四個技術方向,這四個方向的協同創新實現了搜索全鏈路的深度學習技術升級,並具有從傳統的單場景單目標優化到多場景多目標聯合優化的能力;機器學習

再次是在性能優化上作的工做,包括模型壓縮、量化、低秩分解再到二值網絡,大量的技術調研和論證,爲將來提升深度模型預測性能和軟硬件協同優化作了很好的技術鋪墊;ide

最後是排序平臺化,實現了 PC 商品搜索、無線商品搜索、店鋪內搜索搜索和店鋪搜索的搜索服務統一,經過特徵和模型複用,實現了多條業務線技術的快速升級。下面我會簡要的歸納下在四個方向上取得的主要進展和背後的思考。性能

下面是搜索系統和算法的簡圖。系統包括:學習

a. 離線數據平臺 ODPS,負責離線日誌 join、特徵抽取和離線模型預估產出排序特徵,時效性不強的特徵都是經過離線數據平臺產出的,好比用戶性別標籤,商品關鍵字等 ;優化

b. 離線機器學習平臺 PAI,底層是主流的 parameter server 和 TF 深度學習框架,平臺實現了大部分機器學習算法模型的並行訓練和預測,在搜索應用中主要做用是離線模型訓練產出離線排序特徵模型;

c. 流式計算和在線學習平臺 Porsche,流式計算是基於 blink 負責實時日誌解析和特徵 join 生成實時排序特徵,在線學習和離線學習底層框架能夠相同,差異主要是依賴數據源和部分優化方法不一樣,因爲用戶行爲和市場環境變化快,流式計算和在線學習在搜索應用很是普遍,並積累了很多在線學習和強化學習算法;

d. 在線服務平臺,包括引擎、排序服務和搜索平臺組成,負責在線的服務分發、索引查詢、排序服務和結果合併等功能,搜索的排序策略、相關性、個性化等模型主要經過在線預測服務生效。通過多年發展咱們已經具有了很是完善的商品搜索排序算法體系,包括知識圖譜、分詞、tagging、類目預測、意圖預測、拼寫糾錯、query 推薦、query 語義改寫、相關性、商品標籤、商品質量、店鋪分層、用戶 profile、用戶偏好、用戶感知、召回策略、個性化模型、多樣性策略、異構服務混排策略、多目標聯合優化策略、多場景聯合排序策略等,並平臺化的方式賦能相關業務團隊。

搜索系統和算法簡圖

系統進展包括機器學習平臺和在線預測平臺

機器學習平臺。搜索訓練樣本主要來自用戶行爲,因爲用戶行爲是流式數據,適合作在線深度學習,但當模型參數很是龐大須要海量的樣本時在線學習須要很長的時間才能收斂,這時通常是先作離線預訓練再結合增量或在線學習,另外有些模型離線預訓練後在線只須要對接近輸出層的網絡作 fine-tuning。搜索在實際應用的有離線機器學習平臺 PAI 和在線機器學習平臺 Porsche,兩個平臺深度學習框架目前都統一到了 tf-pai, tf-pai 對原生 tf 作了一些優化,好比底層通信,稀疏參數存儲、優化方法、GPU 顯存優化等,比原生 tf 訓練深度有較大的提高,訓練上千億樣本和上百億參數的深度模型毫無壓力。雖然 Porsche 和 PAI 都支持 GPU,但在搜索應用中 CPU 依然是主流,GPU 應用比較少,緣由主要是個性化相對圖像或語音簡單,特徵抽取網絡比較淺,維度相對較低,GPU 的稠密矩陣計算能力得不到充分發揮,同時離在線混布後流量低谷期間騰出了大量的在線服務閒置 CPU,把臨時閒置的 CPU 利用起來作深度學習訓練是一個很是好的思路。

在線預估 RTP,搜索排序算分服務。因爲每次搜索請求有上千個商品須要計算排序分數,深度模型應用對 RTP 服務的壓力是很是大的,RTP 經過採用異構計算,計算算子化和模型分片等方式解決了深度模型 inference 計算和存儲問題,深度模型用 GPU,淺層模型用 CPU,今年雙 11 期間搜索 RTP 服務用到了 550 張 GPU 卡。另外,RTP 還實現了離線 / 在線訓練模型 / 數據和在線預測服務部署的無縫銜接,算法訓練好的模型或數據能夠很輕鬆的部署都在線服務,提高了算法迭代效率。


算法包括智能交互、語義搜索、智能匹配和搜索策略四個方向

智能交互。商品搜索就是帶交互的商品推薦,用戶經過關鍵字輸入搜索意圖,引擎返回和搜索意圖匹配的個性化推薦結果,好的交互技術可以幫助到用戶更好的使用搜索引擎,目前搜索的交互主要是主動關鍵字輸入和關鍵字推薦,好比搜索框中的默認查詢詞和搜索結果中的文字鏈等,推薦引擎根據用戶搜索歷史、上下文、行爲和狀態推薦關鍵字。

和商品推薦的區別是,關鍵字推薦是搜索鏈路的中間環節,關鍵字推薦的收益除了關鍵字的點擊行爲外,還須要考慮對整個購物鏈路的影響,包括在推薦關鍵字的後續行爲中是否有商品點擊、加購和成交或跳轉到另一個關鍵字的後繼行爲,這是一個典型的強化學習問題,action 是推薦的關鍵字候選集合,狀態是用戶當前搜索關鍵詞、上下文等,收益是搜索引導的成交。除了被動的關鍵字推薦,咱們也在思考搜索中更加主動的交互方式,可以作到像導購員同樣的雙向互動,主動詢問用戶需求,挑選個性化的商品和給出個性化的推薦理由,目前阿里搜索團隊已經在作智能導購和智能內容方向的技術原型及論證,智能導購在技術上主要是借鑑對話系統,經過引導用戶和引擎對話與關鍵字推薦方式互爲補充,包括天然語言理解,對話策略,

對話生成,知識推理、知識問答和商品搜索等模塊,功能主要包括:

a. 根據用戶搜索上下文生成引導用戶主動交互的文本,好比搜索「奶粉」時,會生成「您寶寶多大?0~6 個月,6 個月到 1 歲….」引導文案,提示用戶細化搜索意圖,若是用戶輸入「3 個月」後,會召回相應段位的奶粉,並在後續的搜索中會記住對話狀態「3 個月」寶寶和提示用戶「如下是適合 3 個月寶寶的奶粉」。

b. 知識導購,包含提升售前知識問答或知識提示,好比「3 個月寶寶吃什麼奶粉」 回答「1 段」。目前對話技術正在提升中,尤爲是在多輪對話狀態跟蹤、知識問答和自動評價幾個方面,但隨着深度學習、強化學習和生成對抗學習等技術在 NLP、對話策略、閱讀理解等領域的應用,愈來愈多的訓練數據和應用場景,domain specific 的對話技術將來幾年應該會日新月異。智能內容生成,包括生成或輔助人工生成商品和清單的「賣點」,短標題和文本摘要等,讓淘寶商品表達更加個性化和多元化。語義搜索。語義搜索主要是解決關鍵字和商品內容之間的語義鴻溝,好比搜索「2~3 週歲寶寶外套」,若是按照關鍵字匹配召回結果會遠小於實際語義匹配的商品。

語義搜索的範圍主要包括:

a. query tagging 和改寫,好比新品,年齡,尺碼,店鋪名,屬性,類目等搜索意圖識別和歸一化,query tagging 模型是用的經典的序列標註模型 bi-lstm + CRF,而標籤分類(歸一化) 做爲模型另一個任務,將序列標註和分類融合在一塊兒學習。

b. query 改寫,主要是計算 query 之間類似度,把一個 query 改寫成多個語義類似的 query,一般作法是先用不一樣改寫策略生成改寫候選 query 集合,好比詞替換、向量化後 top k、點擊商品類似度等,而後在用 ltr 對後續集合排序找出合適的改寫集合,模型設計和訓練相對簡單,比較難的是如何構建高質量的訓練樣本集合,線上咱們用 bandit 的方法探測部分 query 改寫結果的優劣,離線則用規則和生成對抗網絡生成一批質量較高的樣本。

c. 商品內容理解和語義標籤,經過商品圖片,詳情頁,評價和同義詞,上下位詞等給商品打標籤或擴充商品索引內容,好比用 image tagging 技術生成圖片的文本標籤豐富商品內容,或者更進一步用直接用圖片向量和文本向量融合,實現富媒體的檢索和查詢。

d. 語義匹配,經典的 DSSM 模型技術把 query 和商品變成向量,用向量內積表達語義類似度,在問答或閱讀理解中大量用到多層 LSTM + attention 作語義匹配,一樣高質量樣本,特別是高質量負樣本很大程度上決定了模型的質量,咱們沒有采樣效率很低的隨機負採樣,而是基於電商知識圖譜,經過生成字面類似但不相關的 query 及相關文檔的方法生成負樣本。從上面能夠看到 query tagging、query 類似度、語義匹配和語義相關性是多個目標不一樣但關聯程度很是高的任務。下一步計劃用統一的語義計算框架支持不一樣的語義計算任務,具體包括:

a. 開發基於商品內容的商品表徵學習框架,爲商品內容理解,內容生成,商品召回和相關性提供統一的商品表徵學習框架,重點包括商品標題,屬性,詳情頁和評價等文本信息抽取,圖像特徵抽取和多模信號融合。

b. query 表徵學習框架,爲 query 類目預測,query 改寫,query 推薦等提供統一的表徵學習框架,重點經過多個 query 類似任務訓練統一的 query 表徵學習模型。

c. 語義召回,語義相關性等業務應用模型框架。語義搜索除了增長搜索結果相關性,提高用戶體驗外,也能夠必定程度上遏制淘寶商品標題堆砌熱門關鍵詞的問題。

智能匹配。這裏主要是指個性化和排序。內容包括:

a. ibrain (深度用戶感知網絡),搜索或推薦中個性化的重點是用戶的理解與表達,基於淘寶的用戶畫像靜態特徵和用戶行爲動態特徵,咱們基於 multi-modals learning、multi-task representation learning 以及 LSTM 的相關技術,從海量用戶行爲日誌中直接學習用戶的通用表達,該學習方法善於「總結經驗」、「舉一反三」,使獲得的用戶表達更基礎且更全面,可以直接用於用戶行爲識別、偏好預估、個性化召回、個性化排序等任務,在搜索、推薦和廣告等個性化業務中有普遍的應用場景,感知網絡超過 10B 個參數,已經學習了幾千億次的用戶行爲,而且會保持不間斷的增量學習愈來愈聰明。

b. 多模學習,淘寶商品有文本、圖像、標籤、id 、品牌、類目、店鋪及統計特徵,這些特徵彼此有必定程度的冗餘和互補,咱們利用多模學習經過多模聯合學習方法把多維度特徵融合在一塊兒造成統一的商品標準,並多模聯合學習中引入 self-attention 實現特徵維度在不一樣場景下的差別,好比女裝下圖片特徵比較重要,3C 下文本比較重要等。

c. deepfm,相對 wide & deep 模型,deepfm 增長了特徵組合能力,基於先驗知識的組合特徵可以應用到深度學習模型中,提高模型預測精度。

d. 在線深度排序模型,因爲行爲類型和商品重要性差別,每一個樣本學習權重不一樣,經過樣本池對大權重樣本重複 copy 分批學習,有效的提高了模型學習穩定性,同時經過融合用戶狀態深度 ltr 模型實現了千人千面的排序模型學習。

e. 全局排序,ltr 只對單個文檔打分而後按照 ltr 分數和打散規則排序,容易致使搜索結果同質化,影響總頁效率,全局排序經過已知排序結果作爲上下文預測下一個位置的商品點擊機率,有效提高了總頁排序效率。

f. 另外工程還實現了基於用戶和商品向量的向量召回引擎,相對倒排索引,向量化召回泛化能力更強,對語義搜索和提升個性化匹配深度是很是有價值的。以上實現了搜索從召回、排序特徵、排序模型、個性化和重排的深度學習升級,在雙 11 無線商品搜索中帶來超過 10% (AB-Test) 的搜索指標提高。


多智能體協同窗習實現智能決策

搜索中個性化產品都是成交最大化,致使的問題是搜索結果趨同,浪費曝光,今年作的一個重要工做是利用多智能體協同窗習技術,實現了搜索多個異構場景間的環境感知、場景通訊、單獨決策和聯合學習,實現聯合收益最大化,而不是此消彼長,在今年雙 11 中聯合優化版本帶來的店鋪內和無線搜索綜合指標提高 12% (AB-Test),比非聯合優化版本高 3% (AB-Test)。

性能優化。在深度學習剛起步的時候,咱們意識到深度模型 inference 性能會是一個瓶頸,因此在這方面作了大量的調研和實驗,包括模型壓縮 (剪枝),低秩分解,量化和二值網絡。經過以上技術,今年雙 11 期間在手淘默認搜索、店鋪內搜索、店鋪搜索等均取得了 10% (AB-Test) 以上的搜索指標提高。


阿里巴巴人工智能搜索應用的將來計劃

通用用戶表徵學習。前面介紹的 DUPN 是一個很是不錯的用戶表徵學習模型,但基於 query 的 attention 只適合搜索,同時缺乏基於日誌來源的 attention,難以推廣到其餘業務,在思考作一個可以適合多個業務場景的用戶表徵模型,非搜索業務作些簡單 fine tuning 就能取得比較好的效果;同時用戶購物偏好受季節和週期等影響,時間跨度很是大,最近 K 個行爲序列假設太簡單,咱們在思考可以作 life-long learning 的模型,可以學習用戶過去幾年的行爲序列;

搜索鏈路聯合優化。從用戶進入搜索到離開搜索鏈路中的總體優化,好比 搜索前的 query 引導(底紋),搜索中的商品和內容排序,搜索後的 query 推薦(錦囊)等場景;

跨場景聯合優化。今年搜索內部主搜索和店鋪內搜索聯合優化取得了很好的結果,將來但願可以拓展在更多大流量場景,提升手淘的總體購物體驗;多目標聯合優化。搜索除了成交外,還須要承擔賣家多樣性,流量公平性,流量商業化等居多平臺和賣家的訴求,搜索產品中除了商品搜索外還有「穹頂」,「主題搜索」,「錦囊」,「內容搜索」等非商品搜索內容,不一樣搜索目標和不一樣內容(物種)之間的聯合優化將來很值得深挖。

關注後回覆「AI」你懂的

相關文章
相關標籤/搜索