2018最新實用BAT機器學習算法崗位系列面試總結(結構化數據特徵工程)

特徵工程,是對原始數據進行一系列工程處理,目的是去除原始數據中的雜質和冗餘,設計更高效的特徵來描述求解的問題與預測模型之間的關係。 特徵工程主要對以下兩種常用的數據類型做處理: (1)結構化數據。結構化數據類型可以看作關係型數據庫的一張表,每列都有清晰的定義,包含了數值型,類別型兩種基本類型;每一行數據表示一個樣本的信息。 (2)非結構化數據。非結構化數據主要包括文本,圖像,音頻,視頻數據,其包含
相關文章
相關標籤/搜索