深度學習基礎之特徵工程概述——慕課學習筆記

2.1特徵工程 引自知乎:「數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。」 自動分詞就是將用自然語言書寫的文章、句段經計算機處理後,以詞爲單位給以輸出,爲後續加工處理提供先決條件。 詞根提取(stemming) :是抽取詞的詞幹或詞根形式(不一-定能夠表達完整語義)。 詞形還原(lemmatization) :是把詞彙還原爲一般形式(能表達完整語義)。如將「drove"處理爲
相關文章
相關標籤/搜索