賽題理解——數據挖掘實踐(金融風控)

一、賽題數據 賽題以預測用戶貸款是否違約爲任務,數據集報名後可見並可下載,該數據來自某信貸平臺的貸款記錄,總數據量超過120w,包含47列變量信息,其中15列爲匿名變量。爲了保證比賽的公平性,將會從中抽取80萬條作爲訓練集,20萬條作爲測試集A,20萬條作爲測試集B,同時會對employmentTitle、purpose、postCode和title等信息進行脫敏。 二、字段說明 train.cs
相關文章
相關標籤/搜索