Apache storm 是一個開源集羣計算系統。Storm讓處理大量的數據流變得簡單可靠,就像那些運行在Hadoop 批處理上的實時計算同樣。Storm很簡單,能夠被任何編程語言使用,並且過程很是輕鬆愉快。html
Storm能夠用在不少場景:實時分析,在線機器學習,連續計算,分佈式RPC,ETL等等。Storm很是快速,每秒有超過百萬次的元組(tuples)操做運行在任一節點(node)上。他是可量化(scalable),容錯的,確保全部數據能夠被處理,並且很是簡單部署和操做。node
Storm結合了你已經在使用的隊列(queue)和數據庫技術。一個storm topology消費數據流並用任意複雜的方式去處理這些數據,而且能夠在計算的任意階段(stage)從新分配這些數據流,詳細內容在 指導(the tutorial)數據庫