使用hadoop mapreduce分析mongodb數據

時間 2019-11-17

標籤使用 hadoop mapreduce 分析 mongodb 數據欄目 Hadoop 简体版

原文原文鏈接

使用hadoop mapreduce分析mongodb數據linux

（如今不少互聯網爬蟲將數據存入mongdb中，因此研究了一下，寫此文檔）mongodb

版權聲明：本文爲yunshuxueyuan原創文章。
如需轉載請標明出處： http://www.cnblogs.com/sxt-zkys/
QQ技術交流羣：299142667shell

1、 mongdb的安裝和使用數據庫

一、官網下載mongodb-linux-x86_64-rhel70-3.2.9.tgzapp

二、解壓（能夠配置一下環境變量）工具

三、啓動服務端oop

./mongod --dbpath=/opt/local/mongodb/data --logpath=/opt/local/mongodb/logs --logappend --fork(後臺啓動)spa

第一種：不帶auth認證的3d

第二種：須要帶auth認證的（即須要用戶名和密碼的）blog

當指定用戶名和密碼在查看數據，發現就能夠看獲得了

四、啓動客戶端

./mongo

5、客戶端shell命令

show dbs 顯示mongodb中有哪些數據庫

db 顯示當前正在用的數據庫

use db 你要使用的數據庫名

(注：若database不存在，則會建立一個，此時若不作任何操做直接退出，則MongoDB會刪除該數據庫)

db.auth(username,password) username爲用戶名,password爲密碼登錄你要使用的數據庫

db.getCollectionNames() 查看當前數據庫有哪些表

db.[collectionName].insert({...}) 給指定數據庫添加文檔記錄

db.[collectionName].findOne() 查找文檔的第一條數據

db.[collectionName].find() 查找文檔的所有記錄

db.[collection].update({查詢條件},{$set:{更新內容}}) 更新一條文檔記錄

db.[collection].drop() 刪除數據庫中的集合

db.dropDatabase() 刪除數據庫

2、 Mapreduce 分析mongodb的數據實例

一、編寫mapreduce的代碼前，須要另外添加兩個jar包，還有需（jdk1.7以上）

二、需求介紹與實現

原數據：

結果數據：

代碼編寫：

Job：

Mapper:

Reduce:

最終的結果數據：

3、最後給你們推薦一個mongodb數據庫的管理工具，挺好用的

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。