第十三講 數據變換

數據變換是數據準備的重要環節,它通過數據平滑、數據聚集、數據概化和規範化等方式將數據轉化成適用於數據挖掘的形式。 數據平滑:去除數據中的噪聲,將連續的數據離散化。可採用分箱、聚類和迴歸的方式進行數據平滑。 數據聚集:對數據進行彙總,在SQL中有一些聚集函數,如:Max()、Sum(). 數據概化:用較高的概念替換較低的概念。如:上海、北京、深圳可以概化爲中國。 數據規範化:使屬性數據按比例縮放,將
相關文章
相關標籤/搜索