MF系列一：從Matrix Factorization到Probabilistic Matrix Factorization

時間 2019-11-07

標籤系列 matrix factorization probabilistic 欄目應用數學简体版

原文原文鏈接

矩陣分解算法（Matrix Factorization）是最經常使用於推薦系統的協同過濾算法之一。這一系列的算法曾經是推薦系統中使用的主流算法，即便在如今也在不少地方有用。這裏簡單地梳理從最基礎的matrix factorization（MF）算法到它衍生出來的probabilistic matrix factorization（PMF）的思路，具體解法能夠參看推薦算法——基於矩陣分解的推薦算法和機率矩陣分解這兩個blog。算法

Matrix Factorization

簡單地說，MF 能夠認爲是 Latent Factor Model 思想指導下的一種解決問題的思路，而 latent factor model 其實屬於協同過濾方法的一個分支。筆者在以前的文章中介紹過協同過濾方法。app

在協同過濾方法中，咱們提到了 user-item-preference 矩陣的存在。Latent factor model 的主要思路就是認爲存在某些不可見的、表明用戶偏好的隱變量，用戶的偏好能夠被這些隱變量徹底表明，這些隱變量也能決定用戶對item的偏好。表如今 user-item-preference 矩陣中，即爲咱們能夠將 user-item-preference 矩陣分解爲兩個矩陣的乘積。函數

假設咱們有個user，個item，個隱變量，將 user-item-preference 矩陣用 $R^{N*M}$ 來表示, $U^{D*N}$ 表示user對latent factor的矩陣， $V^{D*M}$ 表示item對latent factor的矩陣。在latent factor model的假設下，矩陣分解算法能夠表示爲 $R \approx U^T * V = \hat{R}$ 。具體來講，對於中的每一個 $r_{i,j}$ ，都有 $r_{i,j} \approx \hat{r_{i,j}} = \sum_{d}^{D}{u_{d,i} * v_{d, j}}$ ，即 $e_{i,j} = r_{i, j} - \sum_{d}^{D}{u_{d,i} * v_{d, j}}$ 。post