初識hadoop 讀hadoop權威指南(二)

這篇開始學習hadoop的hdfs        hdfs 是爲以流式數據訪問模式存儲超大文件而設計的文件系統,不需要再高可靠性的昂貴的硬盤上運行,只需要在普通硬盤上就可以,hdfs不適合延遲率要求在毫秒級別的application。hdfs中的文件只有一個寫入者,而且寫操作總是在文件末尾。        概念 什麼是流式數據?       流式數據就是數據不斷地傳輸,實時處理的數據,也是封裝成爲
相關文章
相關標籤/搜索