機器學習深入與強化--特徵工程

機器學習算法是一個架子,特徵需要我們自己去處理,做出更好的特徵,讓算法去學習,從而達到更好的效果。 意義中靈活性指的是,如果使用的是簡單的LR,處理起來更靈活,更好控制。 做的都是一些基礎的事情,比如: 1、跑數據,但互聯網的數據都是大數據,不會存在一臺服務器上,一般存在HDFS或者Hive表裏,自己去寫mapreduce的任務,去寫HQL去聚合處理這些數據,也就是在數據倉庫裏打雜。 2、數據清洗
相關文章
相關標籤/搜索