硅谷資深數據科學家教你認清探索性數據分析(EDA)的價值

從外表來看,數據科學通常被認爲完全是由高等統計學和機器學習技術組成。然而,另一個重要組成部分往往被低估或遺忘:探索性數據分析(EDA)。EDA指對已有的數據(特別是調查或觀察得來的原始數據)在儘量少的先驗假定下進行探索,通過作圖、製表、方程擬合、計算特徵量等手段探索數據的結構和規律的一種數據分析方法。在深入機器學習或統計建模之前,EDA是一個重要的步驟,這是因爲它提供了爲現有問題開發適當模型並正確
相關文章
相關標籤/搜索