Hadoop對Spark:正面比拼報告(架構、性能、成本、安全性和機器學習)

來自:網絡大數據 每年,市場上都會出現種種不同的數據管理規模、類型與速度表現的分佈式系統。在這些系統中,Hadoop和Spark是獲得最大關注的兩個。然而該怎麼判斷哪一款適合你? 如果想批處理流量數據,並將其導入HDFS或使用Spark Streaming是否合理?如果想要進行機器學習和預測建模,Mahout或MLLib會更好地滿足你的需求嗎? 爲了增加混淆,Spark和Hadoop經常與位於HD
相關文章
相關標籤/搜索