特徵抽取--標籤與索引的轉化: StringIndexer

在機器學習處理過程中,爲了方便相關算法的實現,經常需要把標籤數據(一般是字符串)轉化成整數 索引,或是在計算結束後將整數索引還原爲相應的標籤。 ​StringIndexer轉換器可以把一列類別型的特徵(或標籤)進行編碼,使其數值化,索引的 範圍從0開始,該過程可以使得相應的特徵索引化,使得某些無法接受類別型特徵的算法可 以使用,並提高諸如決策樹等機器學習算法的效率。 索引構建的順序爲標籤的頻率,優
相關文章
相關標籤/搜索