大數據之hadoop早課10.11

1.jps命令是來自哪裏的
2.jps  發現不可用信息,咱們應該怎麼辦
3.pid文件默認存儲哪裏?哪一個文件修改
4.pid文件人爲或Linux系統自動清理,那麼會影響服務的正常運行嗎?  那麼又影響什麼呢
5.面試題,hdfs的讀寫流程誰是output流,誰是input流
6.hadoop fs命令等價什麼命令
7.hdfs上,上傳下載咱們習慣用什麼
8.hdfs dfs  -ls /   這個根目錄是指Linux根目錄嗎?   /前面默認是否是還有一串地址?
9.假如讓大家去官網找 hadoop三個組件的配置文件 網址,大家會不會
11.一個文件250M,塊128M 兩個副本,請問實際存儲多少個塊  存儲空間多少
12.副本放置策略,第一塊放置的策略是什麼
13.簡述SNN是幹什麼的
14.NN節點維護文件系統樹,不會實際存儲文件有哪些塊,塊分佈哪些機器上。
那麼是誰塊報告給NN節點?
拓展題  
生產上好比NN節點設置內存4G  ,那麼通常來講NN節點能夠維護75%的內存的文件樹,說白了就是  存儲文件名稱。那麼當小文件特別多,這樣文件名稱會特別多,對NN節點內存有壓力,有可能會拖垮HDFS,因此生產上通常要小文件合併,什麼叫小文件合併,好比:3個文件 都是10M的,文件名稱字節加起來好比12個字節,那麼合併一個大文件30M,文件名稱就下降4字節,這樣對NN節點壓力就下降了面試

相關文章
相關標籤/搜索