大數據之hadoop早課10.11

時間 2019-11-06

標籤數據 hadoop 早課 10.11 欄目 Hadoop 简体版

原文原文鏈接

1.jps命令是來自哪裏的
2.jps 發現不可用信息，咱們應該怎麼辦
3.pid文件默認存儲哪裏?哪一個文件修改
4.pid文件人爲或Linux系統自動清理，那麼會影響服務的正常運行嗎？那麼又影響什麼呢
5.面試題，hdfs的讀寫流程誰是output流，誰是input流
6.hadoop fs命令等價什麼命令
7.hdfs上，上傳下載咱們習慣用什麼
8.hdfs dfs -ls / 這個根目錄是指Linux根目錄嗎？ /前面默認是否是還有一串地址?
9.假如讓大家去官網找 hadoop三個組件的配置文件網址，大家會不會
11.一個文件250M，塊128M 兩個副本，請問實際存儲多少個塊存儲空間多少
12.副本放置策略，第一塊放置的策略是什麼
13.簡述SNN是幹什麼的
14.NN節點維護文件系統樹，不會實際存儲文件有哪些塊，塊分佈哪些機器上。
那麼是誰塊報告給NN節點?
拓展題
生產上好比NN節點設置內存4G ，那麼通常來講NN節點能夠維護75%的內存的文件樹，說白了就是存儲文件名稱。那麼當小文件特別多，這樣文件名稱會特別多，對NN節點內存有壓力，有可能會拖垮HDFS，因此生產上通常要小文件合併，什麼叫小文件合併，好比：3個文件都是10M的，文件名稱字節加起來好比12個字節，那麼合併一個大文件30M，文件名稱就下降4字節，這樣對NN節點壓力就下降了面試