使用Hadoop的MapReduce來完成大表join

我們都知道在數據庫裏,多個表之間是可以根據某個鏈接鍵進行join的,這也是數據庫的範式規範,通過主外鍵的關聯,由此來減少數據冗餘,提高性能。當然近幾年,隨着NOSQL的興起,出現了基於列的的列式數據庫,典型的有Hbase,MongonDB,Cassdran,等等,NOSQL數據庫弱化了關聯,直接將一整條數據,存入一列,以及去掉了數據庫的部分事務特性,從而在海量數據面前顯得遊刃有餘,當然,大部分的N
相關文章
相關標籤/搜索