1.什麼是SVD :
SVD指的是奇異值分解 SVD SVD的物理意義app
2.利用Python實現SVD機器學習
from numpy import linalg as la # Numpy有一個稱爲linalg的線性代數工具,其中svd計算方法以下 U,Sigma,VT = la.svd(dataMat)
3.利用SVD提升效率
生產實際中的數據比較稀疏,在生產中無論是基於用戶的類似度計算仍是基於物品的類似度計算
都須要較多的時間和不少的計算力,經過SVD能夠將映射到低緯空間中去工具
4.基於SVD的評估方法Python實現(參考自機器學習實戰)學習
def svdEst(dataMat, user, simMeas, item): n = shape(dataMat)[1] simTotal = 0.0; ratSimTotal = 0.0 U,Sigma,VT = la.svd(dataMat)# numpy 的svd計算 Sig4 = mat(eye(4)*Sigma[:4]) #numpy.eye() 生成對角矩陣 # 機器學習實戰的P264中代碼對應的公式推導 https://blog.csdn.net/appleyuchi/article/details/82913217 xformedItems = dataMat.T * U[:,:4] * Sig4.I for j in range(n): userRating = dataMat[user,j] if userRating == 0 or j==item: continue similarity = simMeas(xformedItems[item,:].T,\ xformedItems[j,:].T) print 'the %d and %d similarity is: %f' % (item, j, similarity) simTotal += similarity ratSimTotal += similarity * userRating if simTotal == 0: return 0 else: return ratSimTotal/simTotal
其中計算按照奇異值能到達總能量的90% 計算;dataMat.T U[:,:4] Sig4.I 的推導請參見:推導.net