分佈式建樹(MapReduce)

    公司做廣告業務, 爲了對流量切分,提升廣告效益,結合自身業務用C++寫了一個類決策樹模型(決策樹變種簡化版),開發完成後該模型在提升廣告效果上取得不錯成效,但隨着feature不斷增加, 建樹原始記錄快速增長,單機內存建樹遇到瓶頸,因建樹及分枝裁剪都在內存進行,當數據量超過5000W行後出現內存不足,同時建樹時間也急劇延長。      公司本身有hadoop集羣, 在仔細分析c++建樹代碼
相關文章
相關標籤/搜索