AutoML學習---機器學習01

時間 2019-12-04

標籤 automl 學習機器简体版

原文原文鏈接

1、機器學習

一、機器學習框架

　　轉換爲網絡結構，以下圖所示：網絡

二、框架分析

（1）數值特性：框架

　　① 連續特徵：log^1P、|x| 、e^x、歸一化、離散化、順序號等。機器學習

　　② 離散特徵：頻率、目標編碼、One-hot 編碼、合併、Label-Encoder 等。學習

（2）特徵提取（以文本爲例）：優化

　　特徵特徵提取與特徵選擇有很大的不一樣：前者包括將任意數據（如文本或圖像）轉換爲可用於機器學習的數值特徵。後者是將這些特徵應用到機器學習中。編碼

（3）交叉特徵：spa

　　① 文本交叉特徵：文本類似度、N-gram 集合關係、詞向量差、子串匹配、模糊匹配等。3d

　　② 數值交叉特徵：a-b 、|a-b| 、a>b 、a*b 、 a/b 、 (a-b)²等。code

（4）特徵選擇、降維：blog

　　① 特徵選擇：Stepwise Regression（逐步迴歸）、特徵重要性；

　　② 隨機投影：Locality-Sensitive Hashing 、隨機投影；

　　注：隨機投影矩陣的維度和分佈是受控制的，因此能夠保存任意兩個數據集的距離。所以隨機投影適用於基於距離的方法。

　　③ 線性投影：PCA（主份量分析）、LDA（線性判別分析）；

　　④ 非線性投影：Auto-Encoder（自動編碼？？）、GDA（標準廣義判別分析）。

（5）模型選擇、調參：

　　① 模型選擇：暴力搜索；

　　② 超參數選擇：網格搜索、隨機搜索、Bayes Optimization（貝葉斯優化）。

2、深度學習

一、深度學習框架

　　轉換爲網絡結構，以下圖所示：

二、框架分析

　　相似於機器學習的分析。

三、Neural Architecture Search（神經網絡搜索）

四、控制器的兩種方案

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。