DL應用:query生成和query推薦

1 引言

  在機器翻譯、圖片描述、語義蘊涵、語音識別和文本摘要中,序列到序列的問題已經有太多大牛研究了,也取得了不少突破。谷歌的Attention is all you need[1],捨棄並超越了主流的rnn與cnn序列建模框架,刷出了新的state of the art,這種大膽創新的精神值得咱們學習。後面相信會有更多的attention變體甚至和rnn/cnn結合的電路圖涌現,固然咱們更期待的不是這些,咱們更向往大道至簡。咱們在follow的同時,也指望本身的每個新的想法,新的嘗試可以匯入深度學習的大浪,爲人類的將來貢獻本身的一份力量。
   在電子商務搜索中,query做爲表達用戶意圖的載體起到了很是重要的做用。如何根據用戶的歷史行爲序列給用戶推薦一個query,吸引用戶發生搜索以及後續的成交是很是有意義的,好比淘寶的底紋推薦。以下圖是一個在iphone上的引導圖,歡迎你們多多使用底紋。網絡

 

72ba2d9fc36fd38bf5b9daff07024eb2

2 技術方案

  在技術方案這部分,咱們首先介紹一下總體思路,而後重點討論一下序列embedding.框架

2.1 總體思路

  總的來講,思路主要有兩種:1)編碼解碼直接生成query;2)把user向量和query向量映射到一樣的向量空間裏,而後經過向量類似召回來獲取query,候選query是日誌中已經存在的。下面分別介紹下:iphone

2.1.1 Sequence to sequence[2]  

  大致來講,這種思路通常是首先把source sequence經過一個encoder map成一個vector,而後用這個vector做爲context向量去經過另外一個decoder進行翻譯得出output.後面有不少同行在這個基本思路上作了不少改進,咱們嘗試最基本的一種,沒有把網絡搞的很複雜。以下圖所示,首先獲取用戶的行爲序列,而後 encode成user-embedding向量,而後這個向量做爲context向量來解碼query,每一步解碼一個詞/字。在預測的階段通常採起beam search搜索策略來獲取最可能的topK個候選query的詞序列。學習

相關文章
相關標籤/搜索