FM算法介紹

時間 2019-11-24

標籤算法介紹简体版

原文原文鏈接

概述

FM (Factorization Machine) 算法可進行迴歸和二分類預測，它的特色是考慮了特徵之間的相互做用，是一種非線性模型，目前FM算法是推薦領域被驗證的效果較好的推薦方案之一，在諸多電商、廣告、直播廠商的推薦領域有普遍應用。算法

PAI平臺的FM算法基於阿里內部大數據的錘鍊，具有性能優越、效果突出的特色。具體使用方式能夠參見首頁模板：性能

使用FM算法總體流程須要包含FM訓練和FM預測組件，能夠搭配評估組件使用。學習

目前PAI的FM算法只支持libsvm格式的數據，數據須要包含兩列，分別是特徵列和目標列。大數據

如圖：spa

在「參數設置」中能夠設置迴歸或者分類兩種模式：blog

參數	解釋	取值
tensorColName	訓練的特徵列名 (kv格式的字符串，例如"1:1.0,3:1.0"，特徵的id必須是非負整數，取值範圍是[0,Long.MAX_VALUE)，能夠不連續）	必選
labelColName	label列名 (要求是數值類型，若是任務類型是binary_classification，那麼label值必須是0或1)	必選
task	任務類型	必選，"regression" or "binary_classification"
numEpochs	迭代數	可選，默認值10
dim	因子數，字符串，用逗號分隔的三個整數，表示0次項、線性項、二次項的長度	可選，默認值 "1,1,10"
learnRate	學習率	可選，默認值 0.01
lambda	正則化係數，字符串，用逗號分隔的三個浮點數，表示0次項、線性項、二次項的正則化係數	可選，默認值 "0.01,0.01,0.01"
initStdev	參數初始化標準差	可選，默認值0.05

備註1：字符串