Pyspark+tensorflow-信用貸款數據分析實戰(三)——數據提取

3.數據提取 目的:建立因果關係模型 數據提取的時候要對數據有一定的認識,不能是相關而應該是因果(區分相關關係和因果關係),預測的變量x要在被預測變量y之前取得 相關關係:一個小孩子身高的長高速度和GDP增長的速度就可以做相關關係,但這明顯沒有什麼關係。 因果關係:家庭收入和全國GDP總量,這就明顯具有一定的因果關係。 細分了特徵變量之後,就有了下面的模型框架: 觀察窗口(歷史)看解釋變量: 如果
相關文章
相關標籤/搜索