基於多因素的搭配推薦模型 基於圖像信息的搭配商品推薦

之因此起這個名字是由於對應以前的搭配推薦模型,如以前的博客 基於圖像信息的搭配商品推薦 中所述,能夠看作是基於單因素對搭配進行建模,即認爲搭配的商品應該在單因素--風格上類似,而後在對商品映射後的latent space即風格空間中,搭配的商品的距離會更接近。html

而後更進一步很天然的想法就是:網絡

1)相互搭配的商品是能夠在多個因素上近似的,好比款式、材質、印花、顏色等,而用風格這一個概念來歸納就顯得有些粗糙。post

2)能夠與一個主商品進行搭配的pair商品也能夠是多種風格的,好比一件T恤能夠跟不一樣風格的下裝搭配,搭出運動、休閒、淑女等不一樣的風格。學習

基於這兩種不一樣的思路,能夠採用不一樣的兩種方式進行建模。url

1. Learning Compatibility Across Categories for Heterogeneous Item Recommendation

這篇paper提出一種方法:Mixtures of Non-Metric Embeddings for Recommendation, 簡稱Monomer,是爲了對multiple localized notions of relatedness進行建模,即搭配的商品pair之間是能夠有多種方面的因素的,而以前的搭配建模方式是隻能學習到global notion of relatedness,這也是這種方法可以產出多樣性搭配推薦結果的關鍵點。spa

建模方式:prototype

1)Low-rank Mahalanobis Metric3d

將E看做是商品原始向量到latent space向量的映射關係,則映射後商品pair之間的距離是htm

2)Multiple, Non-Metric Embeddingsblog

由於考慮到相互搭配的商品是能夠在多個因素上近似的,好比款式、材質、印花、顏色等,而用風格這一個概念來歸納就顯得有些粗糙。因此能夠有多個E,即用Ek來表示,每一個Ek能夠看做是一種特徵提取的方式。其中第k種映射空間上,商品pair之間的距離爲:

3)Probabilistic Mixtures of Embeddings

將N種映射方式上的預測距離加權求和,那麼權重如何肯定呢?考慮到非對稱的設定,應該主要與主商品的特徵相關。以下:

where U  is a newly-introduced F*N  parameter matrix with U:;k  being its k -th column.

最終,商品pair的距離爲:

模型訓練:

採用最大似然估計的方式計算loss並進行模型訓練。

 

2. Compatibility Family Learning for Item Recommendation and Generation

這篇paper一樣是基於多因素進行搭配關係的建模,但與上一篇paper不一樣的是,主要假設是:能夠與一個主商品進行搭配的pair商品能夠是多種風格的。

paper提出了一種end-to-end的模型,將每一個item映射到latent space上的K+1的向量,其中1個向量表明該item,另外K個向量表明該item的K個compatible prototypes,這些prototypes反應了搭配建模中的多樣性,便可以與一個主商品進行搭配的pair商品能夠是多種風格的。這K+1個向量便是該item的 compatibility family。

建模方式:

1)Projected Compatibility Distance

PCD是用於衡量兩個商品之間的搭配關係的。

每一個item能夠被E0映射爲一個向量;另外還能夠被Ek(k=1,2,...,K)映射爲K個向量,每一個向量都靠近與其搭配的商品所組成的cluster。PCD的計算方式以下:

用圖來表示的話:

2)最大似然估計

Ek(k=1,2,...,K)的大多數網絡層參數都是共享的,只有最後一層參數是獨立訓練的。

使用最大似然估計進行建模:

模型訓練:

相關文章
相關標籤/搜索