Hadoop解決小文件存儲思路

1.什麼是小文件 小文件一般是指明顯小於Hadoop的block size的文件。Hadoop的block size一般是64MB,128MB或者256MB,現在一般趨向於設置的越來越大。後文要討論的內容會基於128MB,這也是CDH中的默認值。爲了方便後面的討論,Fayson這裏假定如果文件大小小於block size的75%,則定義爲小文件。但小文件不僅是指文件比較小,如果Hadoop集羣中的
相關文章
相關標籤/搜索