數據集成、數據變換下的標準化(最小最大規範化、0均值規範化和小數定標規範化)和連續屬性離散化(等寬法、等頻法和聚類法)

       數據集成:是將儲存咋兩個數據框內的數據,以「關鍵詞」爲依據,以行爲單位做列向合併,是通過merge()函數實現,基本形式:merge(數據框1,數據框2,by="關鍵字")。        但是在數據集成中可能會有這些問題出現: (1)同名異意:數據集A中的ID描述的是菜品單號,數據集B中的ID描述的是訂單編號,則合併的話會出現問題。 (2)異名同意:數據集A中的data描述的是日期
相關文章
相關標籤/搜索