2014年初在工做中開始接觸數據分析,平常工做主要集中於一個小型hadoop集羣的運維以及hive操做。工做開始悠閒下來,要 靜下心來好好沉澱一下大數據的相關知識體系,整理概括的同時要把在工做中用到的技術總結歸併成本身的一套解決方案。初立博客,文章體系確定會比較雜亂,而 且大數據分析涉及到的東西自己就很雜,包括 Java,Linux,Hadoop,kfaka,hbase,hive,oozie,storm,redis,mcache等等,任重道遠,但願本身能 堅持下去。nginx
如下是架構設計圖,包括實時分析和離線分析兩條路線,以nginx開始,以bi結束。
redis