《數據挖掘導論》學習筆記02 數據

  2.1 數據類型 數據挖掘研究常常是爲了適應新的應用領域和新的數據類型的需要而展開的。   屬性與度量 屬性是對象的性質或特性,它因對象而異,或隨時間變化。爲了用一種明確定義的方式做到這一點,我們需要測量標度。   數據集的類型 數據集的一般特性:維度、稀疏性和分辨率。   2.2 數據質量 通常必須解決的數據質量問題包括存在噪聲和離羣點,數據遺漏,不一致或重複,數據有偏差,或者不能代表它應該
相關文章
相關標籤/搜索