1.hdfs 僞分佈式哪三個進程,簡寫
2.yarn僞分佈式哪兩個進程,簡寫
3.簡述 nn作什麼的?
4.簡述 snn是作什麼的那幅圖,是否可以描述清楚?
5.一個文件130M,block設爲128M,系統設置3副本,請問多少塊,多少存儲
6.拓展題: 因此,假如都是5M 10M 20M這些小文件,咱們是否是爲了不nn節點內存的壓力,要不合並這些小文件,要不就將冷數據遷移到好比oss,s3存儲上
7.假如讓你找配置參數,你會在官網找嗎
8.簡述大家對shuffle的理解
9.簡述什麼是數據本地化
10.簡述mr提交到yarn上
11.hive數據分爲 元數據和數據,那麼大家課程中,分別存儲在哪裏分佈式