DistributedCache小記

一、DistributedCache簡介 DistributedCache是hadoop框架提供的一種機制,可以將job指定的文件,在job執行前,先行分發到task執行的機器上,並有相關機制對cache文件進行管理.   常見的應用場景有: 分發第三方庫(jar,so等);分發算法需要的詞典文件;分發程序運行需要的配置;分發多表數據join時小表數據簡便處理等   主要的注意事項有: 1.Dis
相關文章
相關標籤/搜索