hive資料整理系列 三 總體介紹 .

轉載自:http://www.javabloger.com/article/apache-hive-2.html 我的偏見: 對於互聯網公司來說提煉挖掘生產中用戶產生的大量日誌是個有價值的工作,在這些看似垃圾東西中蘊含着大量的商業機會和用戶的需求,如果可以簡單的實現當然皆大歡喜,但是面對龐大的輸出日誌需要去提煉的時候只好束手無則無視他的存在,就拿我們最熟悉的Log4J來說,如果是上TB的海量文本類
相關文章
相關標籤/搜索