No.6大數據入門 | MR實踐:文件分發方式-cacheArchive

上文我們介紹了兩種分發文件方式,接下來我們介紹第三種:通過解壓壓縮包形式進行文件分發:其中white_list是以壓縮包形式上傳的,並且也是需要先上傳至hdfs上,這裏我們的壓縮包如下: 將其上傳至hdfs上: 3)-cacheArchive形式分發 map.py需要重新開發,對目錄進行遍歷並讀取壓縮包文件的內容: #!/usr/bin/python import os import sys
相關文章
相關標籤/搜索