Hadoop DistributedCache使用及原理

概覽 DistributedCache 是一個提供給Map/Reduce框架的工具,用來緩存文件(text, archives, jars and so on)文件的默認訪問協議爲(hdfs://).   DistributedCache將拷貝緩存的文件到Slave節點在任何Job在節點上執行之前。 文件在每個Job中只會被拷貝一次,緩存的歸檔文件會被在Slave節點中解壓縮。     符號鏈接
相關文章
相關標籤/搜索