山東標梵簡單分析下 Node.js 關於集羣的那些事

須要瞭解的基礎概念 一個應用程序中,至少包含一個進程,一個進程至少包含一個線程。前端

進程(Process)是計算機中的程序關於某數據集合上的一次運行活動,是系統進行資源分配和調度的基本單位
線程(Thread)是操做系統可以進行運算調度的最小單位。它被包含在進程之中,是進程中的實際運做單位。
Node 的特色:node

主線程是單進程(後面版本出現了線程概念,開銷較大);
基於事件驅動,異步非阻塞 I/O;
可用於高併發場景。
nodejs 原有版本中沒有實現多線程,爲了充分利用多核 cpu,能夠使用子進程實現內核的負載均衡。c++

node 須要解決的問題:git

node 作耗時的計算時候,形成阻塞。
node 如何開啓子進程
開發過程當中如何實現進程守護
概念太多,咱們從具體案例入手,看看單線程到底會帶來什麼問題。github

單線程的缺點
// file: question.js
const http = require('http');
http.createServer((req, res) => {
if (req.url === '/sum') { // 求和shell

var endTime = new Date().getTime() + 10000
while (new Date().getTime() < endTime) {}
res.end('sum')

} else {npm

res.end('end');

}
}).listen(3000);
操做步驟後端

node question.js
打開瀏覽器,在一個 tab1 上訪問 /sum 。快速打開另外一個 tab2,訪問 / 。
請問會出現什麼現象? 咱們發現 tab1 在轉圈, tab2 也在轉圈,這個現象就很奇怪了。tab1 在轉圈咱們能夠理解,由於咱們須要花費是 10s,可是 tab2 也須要 10s 後,才能被訪問。這就很奇怪了。瀏覽器

這個問題就至關於,別人訪問這個瀏覽器阻塞了 10s,你也要跟着阻塞 10s。這個問題就很難被接受了。所以得出結論,node 不太適合作 cpu 密集型的服務。服務器

如何解決這個問題?
爲了解決這個問題,咱們引入子進程。

file: calc.js

var endTime = new Date().getTime() + 10000
while (new Date().getTime() < endTime) {}

process.send({

time: new Date().getTime()+''

});
改造 question.js

file: question.js
const http = require('http');
const {fork} = require('child_process');
const path = require('path');
http.createServer((req, res) => {
if (req.url === '/sum') { // 求和

// var endTime = new Date().getTime() + 10000
  // while (new Date().getTime() < endTime) {}
  // res.end('sum')
  let childProcess = fork('calc.js', {
    cwd: path.resolve(__dirname)
  });
  childProcess.on('message', function (data) {
    res.end(data.time + '');
  })

} else {

res.end('end');

}
}).listen(3001);
從新啓動 node question.js,發現 tab2,就不會阻塞了。

總結:node 做爲服務器的話,須要開啓子進程來解決 cpu 密集型的操做。以防止主線程被阻塞

子進程的使用 (child_process)
使用的方法

spawn 異步生成子進程
fork 產生一個新的 Node.js 進程,並使用創建的 IPC 通訊通道調用指定的模塊,該通道容許在父級和子級之間發送消息。
exec 產生一個 shell 並在該 shell 中運行命令
execFile 無需產生 shell
spawn
spawn 產卵,能夠經過此方法建立一個子進程

let { spawn } = require("child_process");
let path = require("path");
// 經過node命令執行sub_process.js文件
let childProcess = spawn("node",['sub_process.js'], {
cwd: path.resolve(__dirname, "test"), // 找文件的目錄是test目錄下
stdio: [0, 1, 2]
});
// 監控錯誤
childProcess.on("error", function(err) {
console.log(err);
});
// 監聽關閉事件
childProcess.on("close", function() {
console.log("close");
});
// 監聽退出事件
childProcess.on("exit", function() {
console.log("exit");
});
stdio 這個屬性很是有特點,這裏咱們給了 0,1,2 那麼分別表明什麼呢? stdio

0,1,2 分別對應當前主進程的 process.stdin,process.stdout,process.stderr,意味着主進程和子進程共享標準輸入和輸出
let childProcess = spawn("node",['sub_process.js'], {
cwd: path.resolve(__dirname, "test"), // 找文件的目錄是test目錄下
stdio: [0, 1, 2]
});
能夠在當前進程下打印 sub_process.js 執行結果

默認不提供 stdio 參數時,默認值爲 stdio:['pipe'],也就是隻能經過流的方式實現進程之間的通訊
let { spawn } = require("child_process");
let path = require("path");
// 經過node命令執行sub_process.js文件
let childProcess = spawn("node",['sub_process.js'], {
cwd: path.resolve(__dirname, "test"),
stdio:['pipe'] // 經過流的方式
});
// 子進程讀取寫入的數據
childProcess.stdout.on('data',function(data){

console.log(data);

});
// 子進程像標準輸出中寫入
process.stdout.write('hello');
使用 ipc 方式通訊,設置值爲 stdio:['pipe','pipe','pipe','ipc'],能夠經過 on('message')和 send 方法進行通訊
let { spawn } = require("child_process");
let path = require("path");
// 經過node命令執行sub_process.js文件
let childProcess = spawn("node",['sub_process.js'], {

cwd: path.resolve(__dirname, "test"),
stdio:['pipe','pipe','pipe','ipc'] // 經過流的方式

});
// 監聽消息
childProcess.on('message',function(data){

console.log(data);

});
// 發送消息
process.send('hello');
還能夠傳入ignore 進行忽略 , 傳入inherit表示默認共享父進程的標準輸入和輸出
產生獨立進程
let { spawn } = require("child_process");
let path = require("path");
// 經過node命令執行sub_process.js文件
let child = spawn('node',['sub_process.js'],{

cwd:path.resolve(__dirname,'test'),
stdio: 'ignore',
detached:true // 獨立的線程

});
child.unref(); // 放棄控制
做用:開啓線程後,而且放棄對線程的控制。咱們就能夠不佔用控制太后臺運行了。

fork
衍生新的進程,默認就能夠經過ipc方式進行通訊

let { fork } = require("child_process");
let path = require("path");
// 經過node命令執行sub_process.js文件
let childProcess = fork('sub_process.js', {
cwd: path.resolve(__dirname, "test"),
});
childProcess.on('message',function(data){

console.log(data);

});
fork是基於spawn的,能夠多傳入一個silent屬性, 設置是否共享輸入和輸出

fork原理

function fork(filename,options){

let stdio = ['inherit','inherit','inherit']
if(options.silent){ // 若是是安靜的  就忽略子進程的輸入和輸出
    stdio = ['ignore','ignore','ignore']
}
stdio.push('ipc'); // 默認支持ipc的方式
options.stdio = stdio
return spawn('node',[filename],options)

}
execFile
經過node命令,直接執行某個文件

let childProcess = execFile("node",['./test/sub_process'],function(err,stdout,stdin){

console.log(stdout);

});
內部調用的是spawn方法

exec
let childProcess = exec("node './test/sub_process'",function(err,stdout,stdin){

console.log(stdout)

});
內部調用的是execFile,其實以上的三個方法都是基於spawn的

實現集羣
// file cluster.js 主線程
// 內部原理就是多進程
// 分佈式 前端和後端 集羣 多個功能相同的來分擔工做
// 集羣 就能夠實現多個cpu的負載均衡 通常狀況
// 不一樣進程 監聽同一個端口號
const {fork} = require('child_process');
const cpus = require('os').cpus().length;
const path = require('path');

// 如今主進程中先啓動一個服務
const http = require('http');
let server = http.createServer(function (req,res) {

res.end(process.pid+' '+ ' main end')

}).listen(3000);

for(let i = 0 ; i < cpus-1 ; i++ ){

let cp = fork('server.js',{cwd:path.resolve(__dirname,'worker'),stdio:[0,1,2,'ipc']});
cp.send('server',server); // 我能夠在ipc 模式下第二個參數傳入一個http服務 或者tcp服務

}
// 多個請求都是i/o密集
// cluster 集羣
// file worker/server.js 子進程
const http = require('http');

process.on('message',function (data,server) {

http.createServer(function (req,res) {
    
    res.end(process.pid+' '+ 'end')
}).listen(server); // 多進程監控同一個端口號

})

// file http.get.js 請求腳本
const http = require('http');

for(let i =0 ; i < 10000;i++){

http.get({
    port:3000,
    hostname:'localhost'
},function (res) {
    res.on('data',function (data) {
        console.log(data.toString())
    })
})

}
啓動請求腳本之後,屢次發送請,能夠清楚的發現請求的進程pid 不是同一個pid。

cluster模塊實現集羣
let cluster = require("cluster");
let http = require("http");
let cpus = require("os").cpus().length;
const workers = {};
if (cluster.isMaster) {

cluster.on('exit',function(worker){
    console.log(worker.process.pid,'death')
    let w = cluster.fork();
    workers[w.pid] = w;
})

for (let i = 0; i < cpus; i++) {

let worker = cluster.fork();
workers[worker.pid] = worker;

}
} else {
http

.createServer((req, res) => {
  res.end(process.pid+'','pid');
})
.listen(3000);

console.log("server start",process.pid);
}
上訴的代碼有點反人類,可是 c++ 中也是存在這樣操做進程的。

另外一種方式

// file

const cluster = require('cluster');
const cpus = require('os').cpus();

// 入口文件

cluster.setupMaster({

exec: require('path').resolve(__dirname,'worker/cluster.js'),

});

cluster.on('exit',function (worker) {

console.log(worker.process.pid);
cluster.fork(); // 在開啓個進程

})
for(let i = 0; i < cpus.length ;i++){

cluster.fork(); // child_process fork  會以當前文件建立子進程
// 而且isMaster 爲false 此時就會執行else方法

}
// pm2 專門 開啓 重啓 直接採用集羣的方式
// 模塊
// node worker/cluster.js
// 咱們的項目邏輯不少
const http = require('http');
http.createServer((req, res) => {

if (Math.random() > 0.5) {
  SDSADADSSA();
}
// 在集羣的環境下能夠監聽同一個端口號
res.end(process.pid + ':' + 'end')

}).listen(3000);
pm2應用
pm2能夠把你的應用部署到服務器全部的CPU上,實現了多進程管理、監控、及負載均衡

安裝pm2
npm install pm2 -g # 安裝pm2
pm2 start server.js --watch -i max # 啓動進程
pm2 list # 顯示進程狀態
pm2 kill # 殺死所有進程
pm2 start npm -- run dev # 啓動npm腳本
pm2配置文件
pm2 ecosystem
配置項目自動部署
module.exports = {
apps : [{

name: 'my-project',
script: 'server.js',
// Options reference: https://pm2.io/doc/en/runtime/reference/ecosystem-file/
args: 'one two',
instances: 2,
autorestart: true,
watch: false,
max_memory_restart: '1G',
env: {
  NODE_ENV: 'development'
},
env_production: {
  NODE_ENV: 'production'
}

}],
deploy : {

production : {
  user : 'root',
  host : '39.106.14.146',
  ref  : 'origin/master',
  repo : 'https://github.com/wakeupmypig/pm2-deploy.git',
  path : '/home',
  'post-deploy' : 'npm install && pm2 reload ecosystem.config.js --env production'
}

}
};
pm2 deploy ecosystem.config.js production setup # 執行git clone
pm2 deploy ecosystem.config.js production # 啓動pm2

文章來源:Biaofun標梵互動(https://www.biaofun.com/)

相關文章
相關標籤/搜索