Spark MLlib 特徵抽取、轉化和選擇 -- 特徵選取:卡方選擇器

這一部分主要介紹和特徵處理相關的算法,大體分爲以下三類: 1)特徵抽取:從原始數據中抽取特徵 2)特徵轉換:特徵的維度、特徵的轉化、特徵的修改 3)特徵選取:從大規模特徵集中選取一個子集 特徵選擇(feature Selection)指的是在特徵向量中選擇出那些優秀的特徵,組成新的、更精簡的特徵向量的過程。它在 高維數據分析中十分常用,可以剔除掉‘冗餘’和‘無關’的特徵,提升學習器的性能。 特徵選
相關文章
相關標籤/搜索