pandas - 數據離散化

學習目標 應用cut、qcut實現數據的區間分組 應用get_dummies實現數據的啞變量矩陣 應用:找出股票的漲跌幅異動(異常)值 1 爲什麼要離散化(瞭解) 連續屬性離散化的目的是爲了簡化數據結構,數據離散化技術可以用來減少給定連續屬性值的個數。離散化方法經常作爲數據挖掘的工具。 2 什麼是數據的離散化 連續屬性的離散化就是將連續屬性的值域上,將值域劃分爲若干個離散的區間,最後用不同的符號或
相關文章
相關標籤/搜索