數據挖掘實訓週報week7

本週開始了新的大作業比賽的學習 主要是學習了數據集的一些基本情況 數據集包含約25000家企業數據,其中約15000家企業帶標註數據作爲訓練集,剩餘數據作爲測試集。數據由企業基本信息、企業年報、企業納稅情況等組成,數據包括數值型、字符型、日期型等衆多數據類型(已脫敏),部分字段內容在部分企業中有缺失,其中第一列id爲企業唯一標識。 主要一共有8個數據集,每一行代表一個企業的基本數據,需要給出企業是
相關文章
相關標籤/搜索