機器學習之特徵工程

數據的類型 按照機器學習的數據分類我們可以將數據分成: 標稱型:標稱型目標變量的結果只在有限目標集中取值,如真與假 數值型:數值型目標變量則可以從無限的數值集合中取值,如0.100,42.001等  按照數據的本身分佈特性,可以分爲離散型和聯繫數據: 離散變量是指其數值只能用自然數或整數單位計算的則爲離散變量.例如,班級人數、進球個數、是否是某個類別等等 連續型數據是指在指定區間內可以是任意一個數
相關文章
相關標籤/搜索