學習隨記6————hadoop集羣與spark集羣中的文件格式

文件格式sql rcfile               性能 存儲空間最小,查詢效率最高,須要經過text文件轉化來加載,加載的速度最快,因爲列式存儲方式,數據加載時性能消耗較大,可是具備較好的壓縮比和查詢響應spa textfilespark 存儲空間消耗比較大,而且壓縮的text沒法分割,合併查詢的效率最低,能夠直接存儲,加載數據的速度最高效率 sequencefilefile 存儲空間消耗
相關文章
相關標籤/搜索