如何將pyspark的rdd數據類型轉化爲DataFrame

簡述   在用pyspark進行開發的時候,常常會遇到如何將pyspark讀取的數據使用xgboost的模型進行訓練,固然,若是是使用scala,能夠直接使用xgboost4j,這個庫裏面提供了能夠讀取rdd的數據文件的函數接口,經過scala能夠很簡單的進行訓練,可是對於python用戶來講,如何使用pyspark和xgboost進行訓練,就比較難以處理了?   本人經過對libsvm的數據進行
相關文章
相關標籤/搜索