讀書筆記:Spark上數據的獲取,處理與準備 上

感想 這是文章的第三章,講得還挺詳細的,其中還摻雜着代碼,之後我決定在說理論的時候不貼代碼了,嚴重耽誤個人時間了,我花了差很少一天半的時間讀了這一張,這張講了怎麼處理數據,對數據進行預處理,去掉一些不完整的數據,針對不一樣類型的數據都將其向量化,規範化,正則化,理論很簡單,須要有具體應用場景的工程實踐。 介紹 機器學習是一個極爲普遍的領域,其應用範圍已包括Web和移動應用,物聯網,傳感網絡,金融服
相關文章
相關標籤/搜索