spark gbdt 自定義閾值 取出模型機率,並轉換label

在你們使用spark 的時候,會發現,ML庫下的模型生成的機率是一個Vector,那麼如何將這個Vector的機率爲1的那一列取出呢?而且自定義閾值,按照這個閾值切分獲得label的0,1類呢? 這時候udf函數就派上了很好的用場,廢話很少說,直接上代碼web 取出Vector 的第n列,生成新的dataframe 切分Vector獲得每一列的值,形如調用下面的代碼生成features,對feat
相關文章
相關標籤/搜索