HDFS DATANODE 磁盤容量的最小值

HDFS的DATANODE的剩餘空間具體要到多大?關於這個問題,下面記錄下對這個問題的調查 

昨天,討論羣裏面給出了一個異常: java

Java代碼   收藏代碼
  1. op@odbtest bin]$ hadoop fs -put ../tmp/file3 /user/hadoop/in2  
  2. 14/01/15 02:14:09 WARN hdfs.DFSClient: DataStreamer Exception  
  3. org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /user/hadoop/in2/file3._COPYING_ could only be replicated to 0 nodes instead of minReplication (=1).  There are 1 datanode(s) running and no node(s) are excluded in this operation.  
  4.         at org.apache.hadoop.hdfs.server.blockmanagement.BlockManager.chooseTarget(BlockManager.java:1384)  
  5.         at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:2477)  
  6.         at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.addBlock(NameNodeRpcServer.java:555)  
  7.         at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.addBlock(ClientNamenodeProtocolServerSideTranslatorPB.java:387)  
  8.         at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java:59582)  
  9.         at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:585)  
  10.         at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:928)  
  11.         at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2048)  
  12.         at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2044)  
  13.         at java.security.AccessController.doPrivileged(Native Method)  
  14.         at javax.security.auth.Subject.doAs(Subject.java:396)  
  15.         at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1491)  
  16.         at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2042)  



該異常的只在NN的日誌中拋出,而DN中沒有相關內容,這說明,這是在NN進行block分配的時候作了檢查。 

這種狀況通常都是DATANODE 變成dead,或者是datanode的磁盤容量不夠了。 

因此建議問題提出者,給DN的datadir空出一部分空間以後,操做正常 


可是,該問題的提出者,給出report 數據: node

Java代碼   收藏代碼
  1. [hadoop@odbtest bin]$ hdfs dfsadmin -report  
  2. Configured Capacity: 8210259968 (7.65 GB)  
  3. Present Capacity: 599728128 (571.95 MB)  
  4. DFS Remaining: 599703552 (571.92 MB)  
  5. DFS Used: 24576 (24 KB)  
  6. DFS Used%: 0.00%  
  7. Under replicated blocks: 0  
  8. Blocks with corrupt replicas: 0  
  9. Missing blocks: 0  
  10.   
  11. -------------------------------------------------  
  12. Datanodes available: 1 (1 total, 0 dead)  
  13.   
  14. Live datanodes:  
  15. Name: 192.168.136.128:50010 (odbtest)  
  16. Hostname: odbtest  
  17. Decommission Status : Normal  
  18. Configured Capacity: 8210259968 (7.65 GB)  
  19. DFS Used: 24576 (24 KB)  
  20. Non DFS Used: 7610531840 (7.09 GB)  
  21. DFS Remaining: 599703552 (571.92 MB)  
  22. DFS Used%: 0.00%  
  23. DFS Remaining%: 7.30%  
  24. Last contact: Tue Jan 14 23:47:26 PST 2014  


按照report的數據DFS還剩下(571.92 MB)的大小,應該是能夠建立的,可是拋出了這個異常,確定是對DATANODE的剩餘最小容量作了限制。查了一下HADOOP 2.2.0的源碼, 
org.apache.hadoop.hdfs.server.blockmanagement.BlockPlacementPolicyDefault的方法isGoodTarget中,會對DATANODE的剩餘容量進行判斷: apache

Java代碼   收藏代碼
  1. long remaining = node.getRemaining() -   
  2.                    (node.getBlocksScheduled() * blockSize);   
  3.   // check the remaining capacity of the target machine  
  4.   if (blockSize* HdfsConstants.MIN_BLOCKS_FOR_WRITE>remaining) {  
  5.     if(LOG.isDebugEnabled()) {  
  6.       threadLocalBuilder.get().append(node.toString()).append(": ")  
  7.         .append("Node ").append(NodeBase.getPath(node))  
  8.         .append(" is not chosen because the node does not have enough space ");  
  9.     }  
  10.     return false;  
  11.   }  


代碼中說了,當剩餘容量小於blockSize* HdfsConstants.MIN_BLOCKS_FOR_WRITE的時候,會返回false,而默認狀況下 blockSize* HdfsConstants.MIN_BLOCKS_FOR_WRITE=128M*5=640M> 571.92 MB,這就解釋了這個異常發生的緣由。app

相關文章
相關標籤/搜索