機器學習之數據預處理

一. 導入需要的庫 例如,科學計算的NumPy、數據處理的Pandas。畫圖的包matplotlib。 二. 導入數據集 使用pandas.read_csv讀取csv文件。使用其他的方法讀取不同類型的文檔。 三. 處理數據的缺失值 我們可以使用缺失數據那一列的均值,或者是中位數、衆數來進行替換,如何數據量大的情況下,也可以視情況來進行缺失數據的刪除。 四. 特徵歸一化 樣本的不同的特徵之間的值可能
相關文章
相關標籤/搜索