【自然語言處理】——特徵工程知識體系總結

一、前言      維基百科中給特徵工程做出了簡單定義:特徵工程是利用數據領域的相關知識來創建能夠使機器學習算法達到最佳性能的特徵的過程。簡而言之,特徵工程就是一個把原始數據轉變成特徵的過程,這些特徵可以很好的描述這些數據,並且利用它們建立的模型在未知數據上的表現性能可以達到最優(或者接近最佳性能)。從數學的角度來看,特徵工程就是去設計輸入變量X。 二、特徵工程知識框架 三、特徵清洗      
相關文章
相關標籤/搜索