1.1.談談如何理解shuffle
2.簡述 mr提交到yarn的工做流程
3.yarn哪兩個進程
4.yarn的資源調優參數,是否會配置?
5.談談你對jps命令 pid生成在哪一個目錄
6.談談大家對pid的理解
7.hdfs讀流程是output嗎
8.一個文件160M,64M的塊大小,三個副本,請問塊多少,實際存儲多少
9.pid文件人爲刪除,會影響服務正常運行嗎?那麼會影響什麼?
10.hdfs dfs等價於什麼命令
11.默認的hdfs,yarnweb的端口號多少
12.假如讓大家修改默認的端口號,大家想一想會不會去官網網站的默認配置文件找呢???
13.hdfs和yarn進程的內存大小 在哪一個文件配置
14.談談什麼是數據本地化
15.假如NN節點進入安全模式,大家應該以爲怎麼作
16.副本放置策略,假如提交的DN節點,那麼第一個副本存哪裏
17.hadoop家目錄裏,怎樣找到example jar包
18.大家以爲 命令幫助怎麼看?
web