拼多多面經

時間 2019-12-05

標籤多面简体版

原文原文鏈接

一面自我介紹聊項目說一種你熟悉的模型如何在一個大數據量的狀況下設計一個cache 好比用戶搜索請求數據庫不反覆從數據庫裏讀二面自我介紹聊項目 GBDT的實現，xgboost的實現，二者的差異 xgboost爲何要二階泰勒展開如何選取樣本，正負樣本不均勻的狀況下怎麼處理，爲何不均勻會很差如何洗數據特徵的選擇如何選擇模型隨機森林爲何能夠防止過擬合數據爲何要分片 xgboo

>>阅读原文<<