Spark MLlib 特徵抽取、轉化和選擇 -- 特徵抽取2 Word2Vec

這一部分主要介紹和特徵處理相關的算法,大體分爲以下三類: 1)特徵抽取:從原始數據中抽取特徵 2)特徵轉換:特徵的維度、特徵的轉化、特徵的修改 3)特徵選取:從大規模特徵集中選取一個子集 特徵提取: Word2Vec Word2Vec是一種著名的詞嵌入(Word Embedding)方法,是google在2013年推出的一個NLP工具,他可以計算每個單詞在其給定的語料庫環境下的分佈式詞向量(Dis
相關文章
相關標籤/搜索