利用Spark Rdd生成Hfile直接導入到Hbase

針對大批量插入Hbase的場景,若是單條記錄插入的時候效率比較低下,若是能夠利用Rdd生成Hfile的話,而後利用Bulk Load導入Hfile的話,則會大大提高導入的速度,廢話不說,直接上代碼:html 1.利用Create建立表blog:create 'blog' ,'article'java 2.建立數據文件 blog.txtsql    3.上傳文件至hdfsapache 備註:由於以前
相關文章
相關標籤/搜索