大數據技術學習路線指南:和輕鬆帶你成爲大數據開發工程師!

收集數據: 大數據的第一站就是收集和存儲海量數據(公開/隱私)。現在每個人都是一個巨大的數據源,通過智能手機和個人筆記本釋放出大量的個人行爲信息。獲取數據似乎已經變得越來越容易,數據收集這一模塊最大的挑戰在於獲取海量數據的高速要求以及數據的全面性考慮。 清洗數據:  傳統商業智能在數據清洗處理的做法(ETL)是,把準確的數據放入定義好的格式中,通過基礎的抽取統計生成高維度的數據,方便直接使用。然而
相關文章
相關標籤/搜索