谷歌發佈全新TensorFlow庫「tf.Transform」 簡化機器學習數據預處理過程

在實際的機器學習開發中,開發者通常需要對數據集進行大量的耗時費力的預處理過程,以適應各種不同標準的機器學習模型(例如神經網絡)。這些預處理過程根據待解問題的不同和原始數據的組織形式而各不相同,包括不同格式之間的轉換,分詞、詞幹提取和形成詞彙,以及包括歸一化在內的各種數值操作等等。 實際上,數據的預處理已經成爲了機器學習開發中無法迴避的一個難題。 針對這一難題,谷歌於 22 日通過開發者博客正式發佈
相關文章
相關標籤/搜索