探索性數據分析(Exploratory Data Analysis,簡稱EDA)

EDA就是拿到數據後對數據進行探索,發現數據有何特徵或問題,它可以: 1.更好地理解數據 2.建立對數據的直覺 3.形成假設 4.洞察數據 EDA的一個主要方式就是數據可視化,這讓你可以直觀地看到數據的分佈,模式等。 三個步驟: 1.獲取領域相關知識 每份數據可能都是關於不同行業的,數據探索前,先熟悉相關領域的知識,處理數據時更能遊刃有餘 2.檢查數據是否符合直覺 假如數據有一個特徵年齡,出現了2
相關文章
相關標籤/搜索