企業使用Hadoop的重大挑戰:如何在HDFS中組織和使用數據?

在上一章,我們研究瞭如何在MapReduce中使用不同的文件格式,以及哪些格式適合存儲數據(往期文章請查看文末鏈接)。一旦熟練掌握了數據格式的概念和使用法則,就該思考如何在HDFS中組織數據了。在設計Hadoop系統時,企業應該儘早瞭解如何訪問數據,以便優化將支持的重要用例,這一點非常重要。 本文作爲《Hadoop從入門到精通》大型選題的第四章,主要講解影響企業數據決策的幾大因素,例如是否需要提供
相關文章
相關標籤/搜索