數據挖掘算法之離散化和二元化

離散化和二元化 有些數據挖掘算法,特別是某些分類算法,要求數據是分類屬性形式。發現關聯模式的算法要求數據是二元屬性形式。這樣,常常需要將連續屬性變換成分類屬性(離散化,discretization),並且連續和離散屬性可能都需要變換成一個或多個二元屬性(二元化,binarization)。此外,如果一個分類屬性具有大量不同值(類別),或者某些值出現不頻繁,則對於某些數據挖掘任務,通過合併某些值減少
相關文章
相關標籤/搜索