Pandas數據離散化

數據離散化: 什麼是數據的離散化: 連續屬性的離散化就是將連續屬性的值域上,將值域劃分爲若干個離散的區間,最後用不同的符號或整數值代表落在每個子區間中的屬性值。 爲什麼要離散化: 連續屬性離散化的目的是爲了簡化數據結構,數據離散化技術可以用來減少給定連續屬性值的個數。離散化方法經常作爲數據挖掘的工具。 如何實現數據的離散化: 案例:將上面的例子用pandas實現。 準備數據: data = pd.
相關文章
相關標籤/搜索