流量預測中的數據分佈問題

我們知道機器學習領域中,投入模型的數據具有一個好的數學分佈(主要是高斯分佈)無論是對於數據的清洗預處理還是對於模型的學習都有着非常大的作用。 但是現實問題中的數據一般不是高斯分佈的,所以怎樣將偏態分佈的數據轉換爲正態分佈的數據就很值得研究了。 今天就結合我最近遇到的一個問題講一下log1p函數及其變形。 問題 最近在做流量預測的時候,整理完訓練集的數據發現長這樣: 也可以理解,畢竟不管是網頁流量還
相關文章
相關標籤/搜索