MapReduce的Map Size Join以及Distributed Cache

  首先介紹Distributed Cache(分佈式緩存),主要功能是把DataNode(客戶端)一些小的文件送到DataNode上。 1. 通過job.addCacheFile(new Path(filename).toUri) 2.通過job.addCacheFile(new URI("xx/xxx/xxx/xx.json#customer_type")) 通過1和2來傳過去(都是URI 就
相關文章
相關標籤/搜索