spark-ml 邏輯迴歸使用記錄

    最近作項目須要用一下邏輯迴歸模型,一開始用了spark的基於RDD的mlib,寫了一個版本的腳本,後來看官方文檔發現mlib目前處於維護狀態,主推的仍是基於Dataframe的ml,因而重頭開始寫基於ml的模型腳本,哎,堅強地繼續搬磚python     因爲中間有個指標是事件類型,屬於字符串類型,須要作單獨處理,這裏利用自帶的StringIndexer函數, 主要是根據事件類型出現頻次來
相關文章
相關標籤/搜索