基於Alluxio系統的Spark DataFrame高效存儲管理技術

介紹 越來越多的公司和組織開始將Alluxio和Spark一起部署從而簡化數據管理,提升數據訪問性能。Qunar最近將Alluxio部署在他們的生產環境中,從而將Spark streaming作業的平均性能提升了15倍,峯值甚至達到300倍左右。在未使用Alluxio之前,他們發現生產環境中的一些Spark作業會變慢甚至無法完成。而在採用Alluxio後這些作業可以很快地完成。在這篇文章中,我們將
相關文章
相關標籤/搜索