2.3 缺損值和一般統計量

    接下來,我們要計算出兩種數據值:缺損值和一般統計量。   缺損值主要指的是,數據列中存在缺少或漏掉的數據項,比如 customer_master 中缺少了顧客的姓名或郵箱,transaction 中缺少了交易的數量或金額等等。缺損值的大小對後面的分析非常重要,應儘量讓缺損值越小越好。那麼,首先計算一下 join_data 中各個數據列的缺損值,代碼如下: join_data.isnull(
相關文章
相關標籤/搜索