Hadoop、Pig、Hive、NOSQL 學習資源收集

(一)hadoop 相關安裝部署php

一、hadoop在windows cygwin下的部署:html

http://lib.open-open.com/view/1333428291655java

http://blog.csdn.net/ruby97/article/details/7423088node

http://blog.csdn.net/savechina/article/details/5656937python

二、hadoop 僞分佈式安裝:mysql

http://www.thegeekstuff.com/2012/02/hadoop-pseudo-distributed-installation/linux

三、hadoop全分佈式安裝教程:git

http://hi.baidu.com/leejun_2005/item/367da95bd69f4e0ce6c4a581github

四、基於Eclipse的Hadoop應用開發環境配置web

http://www.cnblogs.com/flyoung2008/archive/2011/12/09/2281400.html

http://blog.sina.com.cn/s/blog_62186b4601012acs.html

關於eclipse沒法鏈接報錯:

"Map/Reduce location status updater". org/codehaus/jackson/map/JsonMappingException

通過查詢,是因爲hadoop的eclipse 插件裏面缺乏了包

按照這篇文章的說明 修改包後 從新運行成功

http://hi.baidu.com/wangyucao1989/blog/item/279cef87c4b37c34c75cc315.html

若是已經安裝了官方插件,發現無法鏈接的,須要先從eclipse中刪除這個jar包.而後重啓eclipse,(防止緩存)

而後再放入新jar包, 再重啓eclipse.

windows下用eclipse鏈接linux中的hadoop,並執行mr

http://superlxw1234.iteye.com/blog/1583164

五、單臺服務器上安裝Hadoop和Hive十五分鐘教程

http://rdc.taobao.com/team/top/tag/hadoop-hive-%E5%8D%81%E5%88%86%E9%92%9F%E6%95%99%E7%A8%8B/

ssh-keygen -t dsa -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

http://blogread.cn/it/article/6103?f=wb

(二)hive

一、基於hive的日誌統計實戰:

http://www.csdn.net/article/2010-11-28/282620

二、Hive實例:CSDN十大經常使用密碼

http://my.oschina.net/leejun2005/blog/81662

三、hive官方教程:

https://cwiki.apache.org/confluence/display/Hive/GettingStarted

四、Hive 隨談(四)– Hive QL

http://www.alidata.org/archives/581   # JOIN

http://wenku.baidu.com/view/242260c489eb172ded63b709.html

五、寫好Hive 程序的五個提示

http://www.alidata.org/archives/622  #排序

六、Hadoop數據倉庫工具--hive介紹(百度)

http://wenku.baidu.com/view/90dad7659b6648d7c1c7460e.html

七、hive 分享(淘寶網)

http://wenku.baidu.com/view/4e4a801ca76e58fafab003b1.html

八、hive簡介(美麗說)

http://wenku.baidu.com/view/0f252121a5e9856a56126025.html

九、Hive學習筆記(阿里巴巴)

http://wenku.baidu.com/view/233308340b4c2e3f5727632a.html

十、Hive - 運用於hadoop的拍字節範圍數據倉庫(論文)

http://wenku.baidu.com/view/b5aebfe9998fcc22bcd10d8a.html

十一、Hive: SQL for Hadoop(An Essential Tool for Hadoop-based Data Warehouses)

http://polyglotprogramming.com/papers/Hive-SQLforHadoop.pdf

十二、Programming Hive

http://www.itpub.net/thread-1724707-1-1.html

1三、Hive 隨談(六)– Hive 的擴展特性:

File Format、SerDe、Map/Reduce 腳本(Transform)、UDF、UDAF

http://www.alidata.org/archives/604

1四、hive 數據傾斜總結

http://www.alidata.org/archives/2109

1五、用hive查詢json格式的複雜數據

http://blog.cloudera.com/blog/2012/09/analyzing-twitter-data-with-hadoop/

https://github.com/rcongiu/Hive-JSON-Serde

1六、同事總結的hive sql 優化

http://hbase.iteye.com/blog/1488745

http://superlxw1234.iteye.com/blog/1564456

1七、經過 thrift 接口實現 python 查詢 hive 數據倉庫

http://slaytanic.blog.51cto.com/2057708/734106

1八、經過 thrift 接口實現 php 查詢 hive 數據倉庫(以及phpHiveAdmin簡介)

http://slaytanic.blog.51cto.com/2057708/766230

http://slaytanic.blog.51cto.com/2057708/818721

http://slaytanic.blog.51cto.com/2057708/1071263

1九、Hive SQL使用和數據加載的一點總結

http://slaytanic.blog.51cto.com/2057708/782175

20、hive優化之——控制hive任務中的map數和reduce數

http://superlxw1234.iteye.com/blog/1582880

2一、hive中一些實用的小技巧

http://superlxw1234.iteye.com/blog/1565774

2二、數據倉庫數據模型之:極限存儲--歷史拉鍊表

http://superlxw1234.iteye.com/blog/1567320

2三、Programing Hive讀書筆記

http://www.gemini5201314.net/hadoop/programing-hive%E8%AF%BB%E4%B9%A6%E7%AC%94%E8%AE%B0.html

(三)pig

一、pig 實戰

http://www.cnblogs.com/xuqiang/archive/2011/06/06/2073601.html

二、pig官方教程

http://pig.apache.org/

三、Apache Pig中文教程集合

http://www.codelast.com/?p=4550

四、Programming Pig

http://ofps.oreilly.com/titles/9781449302641/index.html

http://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CCcQFjAA&url=http%3A%2F%2Fbigdata.googlecode.com%2Ffiles%2FOreilly.Programming.Pig.Sep.2011.pdf&ei=DLGDUNbcI4aTiQfus4HADQ&usg=AFQjCNGzTHIYcc2GuU6ko0TgIKm3UN9T5Q&sig2=2DZtn3yP4KVqro7xt_qAOA

五、PigFly:hadoop 統一數據分析平臺設計(淘寶)

http://www.docin.com/p-344188827.html

http://coderplay.iteye.com/blog/1233865

六、用 Apache Pig 處理百萬歌曲數據(cloudera

http://blog.cloudera.com/blog/2012/08/process-a-million-songs-with-apache-pig/

七、Pig Latin: A Not-So-Foreign Language for Data Processing(斯坦福大學論文)

http://infolab.stanford.edu/~usriv/papers/pig-latin.pdf

八、Lecture 09: Parallel Databases, Big Data, Map/Reduce, Pig-Latin

http://www.cs.washington.edu/education/courses/csep544/11au/lectures/lecture09-parallel-db.pdf

九、Pig Queries Parsing JSON on Amazons Elastic Map Reduce Using S3 Data

http://eric.lubow.org/2011/hadoop/pig-queries-parsing-json-on-amazons-elastic-map-reduce-using-s3-data/

https://github.com/a-b/elephant-bird/tree/master/javadoc

十、pig cookbook:性能調優

http://pig.apache.org/docs/r0.7.0/cookbook.html

http://pig.apache.org/docs/r0.10.0/perf.html#Replicated-Joins

十一、pig stream 用法:

http://wiki.apache.org/pig/PigStreamingFunctionalSpec

http://www.slideshare.net/charmalloc/hadoop-streaming-tutorial-with-python

(四)hadoop原理與編碼

一、hadoop使用中的幾個小細節

http://blog.csdn.net/needle2/article/details/6182515

二、hadoop中map-reduce相關過程與概念的理解:更多請瀏覽目錄

http://hi.baidu.com/shirdrn/item/085a5518be8bfa797b5f25aa

三、hadoop 0.18 中文版官方文檔

http://hadoop.apache.org/docs/r0.20.0/cn/commands_manual.html

四、IBM developerworks:用 Hadoop 進行分佈式並行編程系列, 第 1 ~3 部分

http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/

http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/index.html

https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop3/

五、分佈式計算開源框架Hadoop介紹

http://www.infoq.com/cn/articles/hadoop-intro

六、Hadoop基本流程與應用開發( Java )

http://www.infoq.com/cn/articles/hadoop-process-develop

七、hadoop 源碼分析

http://caibinbupt.iteye.com/?page=2

八、hadoop數據流、做業提交分析

http://www.cnblogs.com/spork/category/226077.html

九、Hadoop管理員的十個最佳實踐

http://www.infoq.com/cn/articles/hadoop-ten-best-practice

十、hadoop、hive源碼分析及使用分享

http://www.oratea.net/?cat=7#

十一、Hadoop計算能力調度器應用和配置(區別於默認的FIFO隊列調度)

http://www.cnblogs.com/ggjucheng/archive/2012/07/25/2608817.html

十二、淺析Hadoop 中的調度策略

http://www.ibm.com/developerworks/cn/opensource/os-hadoop-scheduling/index.html

http://dongxicheng.org/mapreduce/hadoop-schedulers/

Hadoop-0.20.2公平調度器算法解析

http://dongxicheng.org/mapreduce/hadoop-fair-scheduler/

Hadoop計算能力調度器算法解析

http://dongxicheng.org/mapreduce/hadoop-capacity-scheduler/

Hadoop資源感知調度器簡介

http://my.oschina.net/leejun2005/blog/96113

1三、hadoop做業調優參數整理及原理

http://blog.sina.com.cn/s/blog_ae33b83901015cm9.html

1四、比較全的hadoop源碼分析

http://hbase.iteye.com/blog/1024737

1五、如何在Hadoop上編寫MapReduce程序

http://dongxicheng.org/mapreduce/writing-hadoop-programes/

1六、Hadoop學習筆記(二):從map到reduce的數據流

http://www.cnblogs.com/beanmoon/archive/2012/12/08/2805636.html

1七、經過Hadoop的API管理Job

http://blog.csdn.net/dajuezhao/article/details/6591058

1八、揭祕InputFormat:掌控Map Reduce任務執行的利器

http://www.infoq.com/cn/articles/HadoopInputFormat-map-reduce

1九、Hadoop MapReduce開發最佳實踐(上篇)

http://www.infoq.com/cn/articles/MapReduce-Best-Practice-1

20、Hadoop實例:二度人脈與好友推薦

http://my.oschina.net/u/176897/blog/99761

2一、探索大數據分析和 Hadoop

http://www.ibm.com/developerworks/cn/training/kp/os-kp-hadoop/index.html

(五)數據倉庫

一、數據倉庫基礎培訓

http://wenku.baidu.com/view/c788400cba1aa8114431d95b.html

http://wenku.baidu.com/view/412b09e96294dd88d0d26bff.html

二、數據倉庫ods基礎學習

http://wenku.baidu.com/view/bb3e6263caaedd3383c4d3bf.html

三、HBDW-PM-數據倉庫基礎

http://wenku.baidu.com/view/e25bd14769eae009581bec5d.html

(六)Oozie工做流

一、Oozie簡介

http://www.infoq.com/cn/articles/introductionOozie

二、跟着示例學Oozie

http://www.infoq.com/cn/articles/oozieexample

三、擴展Oozie

http://www.infoq.com/cn/articles/ExtendingOozie

四、oozie相關安裝配置與問題解決例子

http://guoyunsky.iteye.com/category/187923

五、oozie總結

http://dirlt.com/oozie.html

(七)HBase

一、hbase官方指南

http://hbase.apache.org/book.html

二、HBase技術介紹

http://www.searchtb.com/2011/01/understanding-hbase.html

三、HBase入門篇2-Java操做HBase例子

http://www.javabloger.com/article/apache-hbase-shell-and-java-api-html.html

四、hbase基本概念和hbase shell經常使用命令用法

http://www.cnblogs.com/flying5/archive/2011/09/15/2178064.html

五、 HBase簡介

http://blog.csdn.net/leeqing2011/article/details/7608261

六、HBase 官方文檔(中文版)

http://www.yankay.com/wp-content/hbase/book.html

七、HBase性能優化方法總結

http://blog.linezing.com/2012/03/hbase-performance-optimization

八、hbase系統架構及數據結構

http://blog.csdn.net/a221133/article/details/6894717

九、[翻譯] HBase存儲架構

http://www.spnguru.com/2010/07/%E7%BF%BB%E8%AF%91-hbase%E5%AD%98%E5%82%A8%E6%9E%B6%E6%9E%84/

十、HBase存儲文件格式概述

http://forchenyun.iteye.com/blog/828549

十一、Hbase, Hive and Pig 介紹(肯特大學)

http://www.cs.kent.edu/~jin/Cloud12Spring/HbaseHivePig.pptx

十二、python 調用HBase 實例

http://hbase.iteye.com/blog/1178063

1三、hbase在淘寶的應用和優化小結

http://walkoven.com/hbase%20optimization%20and%20apply%20summary%20in%20taobao.pdf

1四、hbase僞分佈式安裝指南:

http://my.oschina.net/leejun2005/blog/91952

1五、HBase上關於CMS、GC碎片、大緩存的一種解決方案:Bucket Cache

http://zjushch.iteye.com/blog/1751387   

注:做者來自阿里,據稱讀性能能提高一個數量級,該patch已被hbase社區接受。

1六、HBase 一些 tip

http://www.blogjava.net/changedi/archive/2012/12/28/393577.html

(八)flume

一、Flume日誌收集 原理與實踐

http://www.cnblogs.com/oubo/archive/2012/05/25/2517751.html

二、flume搭建調試

http://log.medcl.net/item/2012/03/flume-build-process/

(九)sqoop

一、sqoop的安裝、配置及使用簡介

http://blog.csdn.net/leeqing2011/article/details/7630690?utm_source=weibolife

二、Sqoop示例

http://baiyunl.iteye.com/blog/964254

三、使用Sqoop在HDFS和RDBMS之間導數據

http://www.linuxidc.com/Linux/2011-10/45080.htm

四、Sqoop User Guide (v1.4.2)

http://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html?utm_source=weibolife#_introduction

五、用sqoop進行mysql和hdfs系統間的數據互導

http://abloz.com/2012/07/19/data-between-the-mysql-and-hdfs-system-of-mutual-conductance-using-sqoop.html

六、Mysql<->sqoop<->HDFS 數據交換實驗

http://leonarding.blog.51cto.com/6045525/1092764

(十)ZooKeeper

一、ZooKeeper Administrator's Guide

http://zookeeper.apache.org/doc/r3.4.3/zookeeperAdmin.html

二、ZooKeeper快速搭建

http://nileader.blog.51cto.com/1381108/795230

三、ZooKeeper管理員指南——部署與管理ZooKeeper

http://blogread.cn/it/article/5917?f=sinat

(十一)NOSQL

一、Redis資料彙總專題

http://blog.nosqlfan.com/html/3537.html

二、MongoDB資料彙總專題

http://blog.nosqlfan.com/html/3548.html

三、NoSQL數據庫筆談

http://sebug.net/paper/databases/nosql/Nosql.html

四、redis入門系列

http://www.cnblogs.com/xhan/archive/2011/02/08/1949867.html

五、Redis經驗談

http://www.programmer.com.cn/14577/

附:個人百度空間(因爲百度的升級門,致使許多博文丟失):

一、http://203.208.46.148/#q=site:baidu.com+hadoop+leejun_2005&hl=zh-CN&newwindow=1&prmd=imvns&ei=J1dwUKyBOcmsiAff9IHwAw&start=10&sa=N&bav=on.2,or.r_gc.r_pw.&fp=2ba1f2c2b0790967&biw=1366&bih=643

ZZ:http://my.oschina.net/leejun2005/blog/81771

 

 

 

學習Hadoop 中總結的資料

 

1)Cygwin相關資料

  (1)Cygwin上安裝、啓動ssh服務失敗、ssh localhost失敗的解決方案

  地址:http://blog.163.com/pwcrab/blog/static/16990382220107267443810/

  (2)windows2003+cygwin+ssh

  地址:http://wenku.baidu.com/view/3777b8bc960590c69ec3765e.html

  (3)Cygwin 安裝和SSH設定教學

  地址:http://blog.faq-book.com/?p=2731

  (4)如何在Cygwin中安裝並配置SSH

  地址:http://blog.csdn.net/souichiro/article/details/6284172

  (5)Cygwin ssh 故障總結

  地址:http://blog.sina.com.cn/s/blog_4abbf0ae0100r8gv.html

  (6)通用線程: OpenSSH 密鑰管理

  地址:http://www.ibm.com/developerworks/cn/linux/security/openssh/part1/index.html

  (7)SSH無密碼登錄問題解決

  地址:http://my.oschina.net/hunzi/blog/10687

  (8)cygwin home路徑問題

  地址:http://zhuang0393.blog.163.com/blog/static/928510420091113111854627/

  (9)cygwin徹底安裝步驟方法

  地址:http://hi.baidu.com/www100/blog/item/e985c717e656b601c93d6d10.html

  (10)windows和cygwin下hadoop安裝配置

  地址:http://www.zihou.me/html/2010/02/19/1525.html

2)Cygwin軟件資源

  (1)Cygwin-Easy-2007光盤運行版和Cygwin-Release-2006光盤安裝版

  地址:http://www.verycd.com/topics/2885338/

  (2)Cygwin徹底版v2.738_20111105

  地址:http://www.verycd.com/topics/2908689/

3)hadoop eclipse plugin相關資料

  (1)各版本編譯hadoop eclipse plugin

  地址:http://www.gemini5201314.net/hadoop/%E5%90%84%E7%89%88%E6%9C%AC%E7%BC%96%E8%AF%91hadoop-eclipse-plugin.html

  (2)hadoop-eclipse-plugin下載

  地址:http://code.google.com/p/hadoop-eclipse-plugin/downloads/list

4)CentOS6.0安裝配置

  (1)CentOS 6 安裝配置教程【完整版】

  地址:http://yp.oss.org.cn/blog/show_resource.php?resource_id=1069

  (2)CentOS6 服務器配置攻略

  地址:http://www.centospub.com/site/centos-6

  (3)CentOS之SSH安裝與配置

  地址:http://apps.hi.baidu.com/share/detail/24759120

  (4)OpenSSH無密碼登錄

  地址:http://blog.csdn.net/jiedushi/article/details/6672894

5)CentOS安裝FTP資料

  (1)CentOS安裝FTP配置總結

  地址:http://bolg.malu.me/html/2011/1798.html

  (2)CentOS安裝VSFTPD FTP服務器

  地址:http://www.embest.net/index.php/archives/23

  (3)CentOS vsftpd虛擬用戶建立步驟

  地址:http://peishuangcai.blog.51cto.com/1316844/463538

  (4)centos 安裝VSFTP

  地址:http://home.phpchina.com/blog-1628-36583.html

  (5)CentOS6 vsFTP安裝與配置(good)

  地址:http://icedot.blog.51cto.com/61369/772452

6)Linux系統命令

  (1)chkconfig命令詳解

  地址:http://www.cnblogs.com/panjun-Donet/archive/2010/08/10/1796873.html

  (2)yum命令詳解

  地址:http://www.cnblogs.com/chuncn/archive/2010/10/17/1853915.html

  (3)wget命令詳解

  地址:http://wenku.baidu.com/view/aba8a48583d049649b6658bc.html

  (4)adduser添加用戶

  地址:http://longlonghui.blog.hexun.com/43140585_d.html

  (5)rpm命令詳解

  地址1:http://blog.sina.com.cn/s/blog_535aa0930100bo3c.html

  地址2:http://wenku.baidu.com/view/1af7c94c852458fb770b5620.html

  (5)scp命令詳解

  地址1:http://www.cnblogs.com/xuxm2007/archive/2010/08/04/1792179.html

  地址2:http://www.21andy.com/blog/20100911/1943.html

  (6)linux的chmod ,chown命令

  地址:http://blog.csdn.net/zdwzzu2006/article/details/6923206

7)SecureCRT使用

  (1)Linux 下 SSH 配合 SecureCRT 的密匙完美使用方法

  地址:http://linkboy.blog.51cto.com/821152/297512

  (2)SecureCRT使用證書管理linux

  地址:http://wenku.baidu.com/view/e116ba33a32d7375a4178039.html

  (3)SecureCRT密鑰遠程登陸Linux

  地址:http://edges.blog.51cto.com/705035/581346

  (4)Linux新建SSH登錄用戶以及Putty和SecureCRT設置

  地址:http://hi.baidu.com/luosiyong/blog/item/e5e1980fb7ddfef3ab6457f7.html

8)Hadoop集羣安裝

  (1)Ubuntu11.10下安裝Hadoop1.0.0(單機僞分佈式)

  地址:http://my.oschina.net/se77en/blog/38804

  (2)hadoop1.0.0 安裝記錄

  地址:http://blog.csdn.net/ylqmf/article/details/7250235

  (3)Hadoop 集羣安裝詳細步驟

  地址:http://www.yanjiuyanjiu.com/2012/01/03/hadoop-cluster-setup/

9)Linux下安裝JDK

  (1)在LINUX下安裝JDK1.6   地址:http://wenku.baidu.com/view/cf91f9d2240c844769eaeef3.html

  (2)Linux AS 安裝 JDK 1.6

  地址:http://www.iteye.com/topic/421608

  (3)linux安裝JDK

  地址:http://wenku.baidu.com/view/efe0c100cc17552707220821.html

10)CentOS修改主機名

  (1)CentOS修改主機名

  地址:http://now-code.com/archives/233

  (2)CentOS(RedHat)命令行修改主機名(主機別名)

  地址:http://www.slyar.com/blog/centos-linux-hostname.html

  (3)CENTOS修改主機名

  地址:http://blog.csdn.net/forest_boy/article/details/5636696

11)Hadoop常見問題集

  (1)Hadoop使用常見問題以及解決方法

  地址:http://wenku.baidu.com/view/3b13d527a5e9856a56126029.html

  (2)No route to host問題的解決

  地址:http://blog.csdn.net/shirdrn/article/details/7280040

  (3)hadoop常見錯誤及處理方法

  地址:http://samwalt.iteye.com/blog/1099348

  (4)Hadoop中常出現的錯誤以及解決方法

  地址:http://blog.sina.com.cn/s/blog_759444350100t2r5.html

  (5)安裝出現的幾種異常的處理方法

  地址:http://hi.baidu.com/xixitie/blog/item/a32f6913cacefb145aaf53dd.html

12)經典示例WordCount

  (1)Hadoop上運行WordCount以及本地調試、

  地址:http://www.beoop.com/archives/244.html

  (2)命令行運行hadoop實例wordcount程序

  地址:http://blog.csdn.net/xw13106209/article/details/6862480

  (3)Hadoop示例程序WordCount運行及詳解

  地址:http://samuschen.iteye.com/blog/763940

  (4)Hadoop的安裝與配置及示例wordcount的運行

  地址:http://wenku.baidu.com/view/41eac9d850e2524de5187ef3.html

13)MapReduce相關資料

  (1)mapreduce 新舊API 區別

  地址:http://blog.csdn.net/xw13106209/article/details/6924458

14)基於Eclipse的Hadoop應用開發

  (1)基於Eclipse的Hadoop應用開發環境配置

  地址:http://www.cnblogs.com/flyoung2008/archive/2011/12/09/2281400.html

  (2) eclipse hadoop開發環境配置

  地址:http://blog.csdn.net/cybercode/article/details/7084603

  (3)Eclipse運行hadoop(解決錯誤)

  地址:http://sunjun041640.blog.163.com/blog/static/25626832201061751825292/

  (4)Permission denied

  地址:http://www.cnblogs.com/acmy/archive/2011/10/28/2227901.html

  (5)hadoop-eclipse開發環境搭建及error: failure to login錯誤

  地址:http://blog.csdn.net/chengfei112233/article/details/7252404

  (6)hadoop mapred(hive)執行目錄 文件權限問題

  地址:http://blog.csdn.net/azhao_dn/article/details/6921398

  (7)cannot submit job from Eclipse plugin running on Windows

  地址:https://issues.apache.org/jira/browse/HADOOP-8089

  (8)Hadoop初學者可能會遇到的問題

  地址:http://bbs.hadoopor.com/thread-3967-1-1.html

15)CentOS下裝MySQL

  (1)Linux系統上安裝MySQL 5.5prm

  地址:http://www.cnblogs.com/sunson/articles/2172086.html

  (2)linux下mysql(rpm)安裝使用手冊

  地址:http://www.cnblogs.com/sunwei2012/archive/2011/02/16/1956547.html

  (3)Linux下如何更改Mysql默認的數據文件目錄

  地址:http://hi.baidu.com/braveboyx/blog/item/38a169f2ea0237d57831aa5f.html(重點)

  (4)設置MySql5.5數據庫的字符編碼爲UTF8,解決中文亂碼問題

  地址:http://kimho.iteye.com/blog/1141608

  (5)ubuntu_Linux下建設FTP服務器(完整)

  地址:http://blog.csdn.net/xuchenguang/article/details/677301

16)Java中處理帶BOM的UTF-8信息

  (1)Java讀帶有BOM的UTF-8文件亂碼緣由及解決方法

  地址:http://daimojingdeyu.iteye.com/blog/397661

  (2)Java解決UTF-8 BOM問題

  地址:http://blog.csdn.net/dream_it_life/article/details/6045140

  (3)UTF8格式中的BOM問題

  地址:http://yuaqian2003.iteye.com/blog/1335730

17)MapReduce與MySQL交互

  (1)hadoop與mysql數據庫相連讀出數據

  地址:http://blog.csdn.net/qwertyu8656/article/details/6426054

  (2)Hadoop中DBInputFormat和DBOutputFormat使用

  地址:http://blog.csdn.net/dajuezhao/article/details/5799371

 18)HBase相關資料

  (1)Hadoop0.20.203.0+Hbase0.90.4徹底分佈式配置

  地址:http://www.cnblogs.com/flyoung2008/archive/2011/12/02/2272761.html

  (2)Hbase安裝配置(含分佈式ZooKeeper)

  地址:http://linuxjcq.blog.51cto.com/3042600/760634

  (3)HBase分佈式模式的安裝、配置和使用

  地址:http://www.mcncc.com/thread-80401-1-1.html

  (4)HBase技術介紹

  地址:http://www.searchtb.com/2011/01/understanding-hbase.html

  (5)HBase入門筆記(四)--徹底分佈式HBase集羣安裝配置

  地址:http://www.cnblogs.com/ventlam/archive/2011/01/22/HBaseCluster.html

  (6)hbase 沒法啓動問題 時間設置

  地址:http://taoo.iteye.com/blog/1266576

  (7)hbase 結點之間時間不一致形成regionserver啓動失敗

  地址:http://www.gather-data.info/blog/?p=2454

  (8)eclipse寫MAPREDUCE程序對HBase表進行操做之 IndexBuilder(對已有表建索引)

  地址:http://blog.csdn.net/liuxingjiaofu/article/details/7188375

  (9)基於Java的HBase客戶端編程

  地址:http://tech.it168.com/a2011/0815/1232/000001232755_2.shtml

  (10)HBase client API Guide

  地址:http://www.spnguru.com/2010/07/hbase-client-api-guide/

19)HBase的性能優化

  (1)HBase入門篇3-hbase 配置文件參數設置及優化

  地址:http://blog.csdn.net/a221133/article/details/6777433

  (2)HBase性能優化方法總結

  地址:http://www.cnblogs.com/panfeng412/tag/%E6%80%A7%E8%83%BD%E4%BC%98%E5%8C%96/

  (3)HBase性能調優

  地址:http://kenwublog.com/hbase-performance-tuning

  (4)HBase 在淘寶的應用和優化小結

  地址:http://www.oschina.net/question/195301_41176

  (5)HBase性能深度分析

  地址:http://www.blogjava.net/ivanwan/archive/2011/06/10/352071.html

  (6)提高HBase性能的幾個地方

  地址:http://www.itokit.com/2011/0516/66217.html

20)Hive安裝及簡介

  (1)hive安裝過程

  地址:http://blog.csdn.net/gudaoqianfu/article/details/7319287

  (2)Hive安裝及問題解決

  地址:http://blog.csdn.net/lengzijian/article/details/7042280

  (3)hive 配置

  地址:http://blog.csdn.net/wf1982/article/details/6641827

  (4)hive的Specified key was too long; max key length is 767 bytes問題解決

  地址:http://blog.csdn.net/lengzijian/article/details/7045538

  (5)hive元數據存儲在mysql 字符集utf8 修改

  地址:http://blog.csdn.net/tylgoodluck/article/details/7009952

  (6)配置hadoop HIVE元數據保存在mysql中

  地址:http://space.itpub.net/?uid-22418990-action-viewspace-itemid-718885

  (7)Hive 結構

  地址:http://www.tbdata.org/archives/499

  (8)HIVE RCFile高效存儲結構

  地址:http://blog.csdn.net/wh62592855/article/details/6409680

  (9)Hive安裝配置詳細

  地址:http://yymmiinngg.iteye.com/blog/708230

21)Hive的應用開發

  (1)經過JDBC驅動鏈接Hive操做實例

  地址:http://blog.csdn.net/kunshan_shenbin/article/details/7214491

  (2)java 經過jdbc驅動鏈接hive操做實例

  地址:http://blog.csdn.net/a221133/article/details/6734762

  (3)Hive的JDBC鏈接

  地址:http://cloud.csdn.net/a/20101128/282618.html

  (4)基於Hive的日誌數據統計實戰

  地址:http://cloud.csdn.net/a/20101128/282620.html

  (5)HiveClient

  地址:https://cwiki.apache.org/confluence/display/Hive/HiveClient

22)HBase、Hive與RDBMS關係

  (1)Hive與數據庫的異同

  地址:http://cloud.csdn.net/a/20101128/282617.html

  (2)Hive HBase 整合

  地址:http://running.iteye.com/blog/898399

  (3)hive與hbase   地址:http://hi.baidu.com/wuhanjzl/blog/item/3d3c4412d85dd7e8c2ce7978.html

  (4)Hive與Hbase的區別

  地址:http://hi.baidu.com/gcpopo/blog/item/fe8c25add0efe6d07dd92a68.html

  (5)Hive和HBase整合

  地址:http://hotdog.iteye.com/blog/1203488

  (6)Hive HBase整合使用

  地址:http://datalife.iteye.com/blog/910300

  (7)Hadoop Hive與Hbase整合

  地址:http://blog.csdn.net/hguisu/article/details/7282050

  (8)僞分佈式環境下,Hive0.8.1與HBase0.92.0集成的配置說明 (good)

  地址:http://blog.csdn.net/fullofwindandsnow/article/details/7331403

  (9)Hbase 與RDBMS的區別

  地址:http://qa.taobao.com/?p=11852

  (10)Hive HBase Integration

  地址:https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration

 

 

 

學習Hadoop不錯的系列文章

1)Hadoop學習總結

  (1)HDFS簡介

  (2)HDFS讀寫過程解析

  (3)Map-Reduce入門

  (4)Map-Reduce的過程解析

  (5)Hadoop的運行痕跡

  (6)Apache Hadoop 版本 

2)Hadoop-0.20.0源代碼分析

  (1)Hadoop-0.20.0源代碼分析(01)

  地址:http://blog.csdn.net/shirdrn/article/details/4569702

  (2)Hadoop-0.20.0源代碼分析(02)

  地址:http://blog.csdn.net/shirdrn/article/details/4571445

  (3)Hadoop-0.20.0源代碼分析(03)

  地址:http://blog.csdn.net/shirdrn/article/category/595039/3

  (4)Hadoop-0.20.0源代碼分析(04)

  地址:http://blog.csdn.net/shirdrn/article/details/4574402

  (5)Hadoop-0.20.0源代碼分析(05)

  地址:http://blog.csdn.net/shirdrn/article/details/4577243

  (6)Hadoop-0.20.0源代碼分析(06)

  地址:http://blog.csdn.net/shirdrn/article/details/4581473

  (7)Hadoop-0.20.0源代碼分析(07)

  地址:http://blog.csdn.net/shirdrn/article/details/4581666

  (8)Hadoop-0.20.0源代碼分析(08)

  地址:http://blog.csdn.net/shirdrn/article/details/4581666

  (9)Hadoop-0.20.0源代碼分析(09)

  地址:http://blog.csdn.net/shirdrn/article/details/4590359

  (10)Hadoop-0.20.0源代碼分析(10)

  地址:http://blog.csdn.net/shirdrn/article/details/4594892

  (11)Hadoop-0.20.0源代碼分析(11)

  地址:http://blog.csdn.net/shirdrn/article/details/4598295

  (12)Hadoop-0.20.0源代碼分析(12)

  地址:http://blog.csdn.net/shirdrn/article/details/4598419

  (13)Hadoop-0.20.0源代碼分析(13)

  地址:http://blog.csdn.net/shirdrn/article/details/4604229

  (14)Hadoop-0.20.0源代碼分析(14)

  地址:http://blog.csdn.net/shirdrn/article/details/4608377

  (15)Hadoop-0.20.0源代碼分析(15)

  地址:http://blog.csdn.net/shirdrn/article/details/4610578

  (16)Hadoop-0.20.0源代碼分析(16)

  地址:http://blog.csdn.net/shirdrn/article/details/4631518

  (17)Hadoop-0.20.0源代碼分析(17)

  地址:http://blog.csdn.net/shirdrn/article/details/4634119

  (18)Hadoop-0.20.0源代碼分析(18)

  地址:http://blog.csdn.net/shirdrn/article/details/4636169

  (19)Hadoop-0.20.0源代碼分析(19)

  地址:http://blog.csdn.net/shirdrn/article/details/4639345

相關文章
相關標籤/搜索