本博客主要摘錄了《機器學習實戰》裏面對各個算法的總結算法
精度高、對異常值不敏感、無數據輸入假定機器學習
計算複雜度高、空間複雜度高函數
數值型和標稱型性能
計算複雜度不高,輸出結果易於理解,對中間值的缺失不敏感,能夠處理不相關特徵數據學習
可能會產生過分匹配的問題大數據
數值型和標稱型編碼
在數據較少的狀況下仍然有效,能夠處理多類別問題博客
對於輸入數據的準備方式比較敏感io
標稱型數據map
計算代價不高,容易理解和實現
容易欠擬合,分類精度可能不高
數值型和標稱型數據
泛化錯誤率低,計算開銷不大,容易解釋
對參數調節和核函數的選擇敏感,原始分類器不加修飾僅適用於處理二類問題
數值型和標稱型數據
泛化錯誤率低,易編碼,能夠應用在大部分分類器上,無參數調整
對離羣點敏感
數值型和標稱型數據
結果易於理解,計算上不復雜
對非線性的數據擬合很差
數值型和標稱型數據
能夠對複雜和非線性的數據建模
結果不易理解
數值型和標稱型數據
容易實現
可能收斂到局部最小值,在大規模數據集上收斂較慢
數值型數據
易編碼實現
在大數據集上可能較慢
數值型和標稱型數據
通常要快於Apriori
實現比較困難,在某些數據集上性能會降低
標稱型數據
下降數據的複雜性,識別最重要的多個特徵
不必定須要,且可能損失有用信息
數值型數據
簡化數據,去除噪聲,提升算法結果
數據的轉換可能難以理解
數值型數據
可在短期內完成大量工做
算法必須通過重寫,須要對系統工程有必定的理解
數值型和標稱型數據