任何實矩陣\(\textbf{A} \in \mathbb{R}^{m \times n}\)均可以分解爲機器學習
其中, \(\textbf{U} \in \mathbb{R}^{m \times m}\)和\(\textbf{V} \in \mathbb{R}^{n \times n}\)分別爲知足\(\textbf{U}^T\textbf{U} = \textbf{I}\)以及\(\textbf{V}^T\textbf{V} = \textbf{I}\)的m階與n階酉矩陣. 其中\((\Sigma)_{ii} = \sigma_i\)且其它位置的元素均爲0, \(\sigma_i\)爲非負實數且知足\(\sigma_1 \geqslant \sigma_2 \geqslant ... \geqslant 0\).ide
式(1)爲奇異值分解(SVD), 其中\(\textbf{U}\)的列向量\(\textbf{u}_i \in \mathbb{R}^m\)稱爲\(\textbf{A}\)的左奇異向量, \(\textbf{V}\)的列向量\(\textbf{v}_i \in \mathbb{R}^n\)稱爲\(\textbf{A}\)的右奇異向量, \(\sigma^i\)稱爲奇異值. 矩陣的秩就等於非零奇異值的個數。學習
給定一個秩爲\(r\)的矩陣\(\textbf{A}\), 欲求其最優\(k\)秩近似矩陣\(\widetilde{\textbf{A}}, k \leqslant{r}\), 該問題可形式化爲spa
對矩陣\(\textbf{A}\)進行奇異值分解後,將矩陣\(\Sigma\)中的 \(r\ - \ k\) 個最小的奇異值置零得到矩陣\(\Sigma_k\), 僅保留最大的\(k\)個奇異值, 則
it
reference:
《機器學習》 by 周志華class