金融風險管理:賽題理解

數據分析四大步驟 賽題:以預測用戶貸款是否違約爲任務。數據來自某信貸平臺的貸款記錄,總數據量超過120w,包含47列變量信息,其中15列爲匿名變量。爲了保證比賽的公平性,將會從中抽取80萬條作爲訓練集,20萬條作爲測試集A,20萬條作爲測試集B,同時會對employmentTitle、purpose、postCode和title等信息進行脫敏。 賽題數據 初始特徵有許多,部分展示如下。 評價標準:
相關文章
相關標籤/搜索