之因此起這個名字是由於對應以前的搭配推薦模型,如以前的博客 基於圖像信息的搭配商品推薦 中所述,能夠看作是基於單因素對搭配進行建模,即認爲搭配的商品應該在單因素--風格上類似,而後在對商品映射後的latent space即風格空間中,搭配的商品的距離會更接近。html
而後更進一步很天然的想法就是:網絡
1)相互搭配的商品是能夠在多個因素上近似的,好比款式、材質、印花、顏色等,而用風格這一個概念來歸納就顯得有些粗糙。post
2)能夠與一個主商品進行搭配的pair商品也能夠是多種風格的,好比一件T恤能夠跟不一樣風格的下裝搭配,搭出運動、休閒、淑女等不一樣的風格。學習
基於這兩種不一樣的思路,能夠採用不一樣的兩種方式進行建模。url
這篇paper提出一種方法:Mixtures of Non-Metric Embeddings for Recommendation, 簡稱Monomer,是爲了對multiple localized notions of relatedness進行建模,即搭配的商品pair之間是能夠有多種方面的因素的,而以前的搭配建模方式是隻能學習到global notion of relatedness,這也是這種方法可以產出多樣性搭配推薦結果的關鍵點。spa
建模方式:prototype
1)Low-rank Mahalanobis Metric3d
將E看做是商品原始向量到latent space向量的映射關係,則映射後商品pair之間的距離是htm
2)Multiple, Non-Metric Embeddingsblog
由於考慮到相互搭配的商品是能夠在多個因素上近似的,好比款式、材質、印花、顏色等,而用風格這一個概念來歸納就顯得有些粗糙。因此能夠有多個E,即用Ek來表示,每一個Ek能夠看做是一種特徵提取的方式。其中第k種映射空間上,商品pair之間的距離爲:
3)Probabilistic Mixtures of Embeddings
將N種映射方式上的預測距離加權求和,那麼權重如何肯定呢?考慮到非對稱的設定,應該主要與主商品的特徵相關。以下:
where U is a newly-introduced F*N parameter matrix with U:;k being its k -th column.
最終,商品pair的距離爲:
模型訓練:
採用最大似然估計的方式計算loss並進行模型訓練。
這篇paper一樣是基於多因素進行搭配關係的建模,但與上一篇paper不一樣的是,主要假設是:能夠與一個主商品進行搭配的pair商品能夠是多種風格的。
paper提出了一種end-to-end的模型,將每一個item映射到latent space上的K+1的向量,其中1個向量表明該item,另外K個向量表明該item的K個compatible prototypes,這些prototypes反應了搭配建模中的多樣性,便可以與一個主商品進行搭配的pair商品能夠是多種風格的。這K+1個向量便是該item的 compatibility family。
建模方式:
1)Projected Compatibility Distance
PCD是用於衡量兩個商品之間的搭配關係的。
每一個item能夠被E0映射爲一個向量;另外還能夠被Ek(k=1,2,...,K)映射爲K個向量,每一個向量都靠近與其搭配的商品所組成的cluster。PCD的計算方式以下:
用圖來表示的話:
2)最大似然估計
Ek(k=1,2,...,K)的大多數網絡層參數都是共享的,只有最後一層參數是獨立訓練的。
使用最大似然估計進行建模:
模型訓練: