VectorAssembler的稀疏向量轉密集向量

在通過VectorAssembler將多列特徵值和並後,由於spark存儲格式的原因,會將含有很多0值的一行轉爲稀疏向量sparseVector 進行存儲。然而在後續計算過程中,我們需要的是密集向量,所以需要將稀疏向量轉爲密集向量。 1.先通過VectorAssembler將需要的列轉成向量列 2.轉爲RDD後map操作,將feature列中的元素轉爲DenseVector
相關文章
相關標籤/搜索