拼多多面經

一面 自我介紹 聊項目 說一種你熟悉的模型 如何在一個大數據量的狀況下 設計一個cache 好比用戶搜索請求數據庫 不反覆從數據庫裏讀 二面 自我介紹 聊項目 GBDT的實現,xgboost的實現,二者的差異 xgboost爲何要二階泰勒展開 如何選取樣本,正負樣本不均勻的狀況下怎麼處理,爲何不均勻會很差 如何洗數據 特徵的選擇 如何選擇模型 隨機森林爲何能夠防止過擬合 數據爲何要分片 xgboo
相關文章
相關標籤/搜索