做爲一名程序員通病就是不安分,對業界的技術總要折騰一番,哪怕在最終實際工做中應用到的就那麼一點。最近本身準備入門Storm學習,關於流式大數據框架目前比較流行的有Spark和Storm等,在入門以前,先對兩種框架作個基本的對比,便於後期學習中更加深刻的理解各自的應用場景以及優劣。關於Storm和Spark的對比主要從網絡和書本搜索獲得,基本比較以下:程序員
對比方面 | Storm | Spark Streaming |
是否實時模型 | 純實時 | 準實時 |
實時計算延時度 | 毫秒級 | 秒級 |
吞吐量 | 低 | 高 |
事務機制 | 支持且完善 | 支持,但不完善 |
健壯/容錯 | 強 | 通常 |
動態調整並行度 | 支持 | 不支持 |
從上面的對比能夠看出,Storm的使用場景適合對實時性要求高、延時度要求低、對事務機制要求保障的應用。但對比之下,Spark的優點則主要體如今一下兩個方面:網絡
一、吞吐量更大。框架
二、Spark生態技術棧中,Spark Streaming能夠和Spark Core、Spark SQL無縫集成,提供了更加全面的整合應用。學習
具體應用體驗,在學習完兩個框架,並作實際對比後補充~~~大數據