使用hadoop mapreduce分析mongodb數據

使用hadoop mapreduce分析mongodb數據linux

(如今不少互聯網爬蟲將數據存入mongdb中,因此研究了一下,寫此文檔)mongodb

版權聲明:本文爲yunshuxueyuan原創文章。
如需轉載請標明出處: http://www.cnblogs.com/sxt-zkys/
QQ技術交流羣:299142667shell

1、 mongdb的安裝和使用數據庫

一、 官網下載mongodb-linux-x86_64-rhel70-3.2.9.tgzapp

 

二、 解壓 (能夠配置一下環境變量)工具

三、 啓動服務端oop

./mongod  --dbpath=/opt/local/mongodb/data --logpath=/opt/local/mongodb/logs  --logappend  --fork(後臺啓動)spa

第一種:不帶auth認證的3d

 

第二種:須要帶auth認證的(即須要用戶名和密碼的)blog

 

當指定用戶名和密碼在查看數據,發現就能夠看獲得了

 

四、 啓動客戶端

./mongo

 

5、客戶端shell命令

show dbs    顯示mongodb中有哪些數據庫

 

db    顯示當前正在用的數據庫

 

use db    你要使用的數據庫名

 

(注:若database不存在,則會建立一個,此時若不作任何操做直接退出,則MongoDB會刪除該數據庫)

db.auth(username,password)  username爲用戶名,password爲密碼 登錄你要使用的數據庫

db.getCollectionNames()  查看當前數據庫有哪些表

 

db.[collectionName].insert({...})  給指定數據庫添加文檔記錄

 

db.[collectionName].findOne()   查找文檔的第一條數據

db.[collectionName].find()   查找文檔的所有記錄

 

db.[collection].update({查詢條件},{$set:{更新內容}})   更新一條文檔記錄

 

db.[collection].drop()   刪除數據庫中的集合

 

db.dropDatabase()   刪除數據庫

 

2、 Mapreduce 分析mongodb的數據實例

 

一、 編寫mapreduce的代碼前,須要另外添加兩個jar包,還有需(jdk1.7以上)

  

二、 需求介紹與實現

原數據:

 

結果數據:

 

代碼編寫:

Job:

 

Mapper:

 

Reduce:

 

最終的結果數據:

 

 

3、 最後給你們推薦一個mongodb數據庫的管理工具,挺好用的

    

相關文章
相關標籤/搜索