【Linux】單計算機安裝PBS系統(Torque)與運維

一、這次使用torque-5.0.0-1_43d8f09a.tar.gz這個版本http://www.adaptivecomputing.com/downloading/?file=/torque/torque-5.0.0-1_43d8f09a.tar.gz,我所使用的linux系統是centos6.5。將torque源碼包下載至linux根目錄下的tmp文件夾,tar -xf命令解壓。並安裝如下編譯工具:node

yum install libtool-devel libxml2-devel openssl-devel gcc gcc-c++ boost-devel

二、cd命令進入解壓後的文件夾torque-5.0.0-1_43d8f09a,切換爲root用戶,逐次運行下列四條命令:python

./configure
make
sudo make install
make packages

最後一條命令會在文件夾內產生下面這些.sh腳本:linux

torque-package-clients-linux-x86_64.sh
torque-package-devel-linux-x86_64.sh
torque-package-doc-linux-x86_64.sh
torque-package-mom-linux-x86_64.sh
torque-package-server-linux-x86_64.shc++

在本機安裝腳本:git

./torque-package-clients-linux-x86_64.sh --install ./torque-package-mom-linux-x86_64.sh --install

在目錄即/tmp/torque-5.0.0-1_43d8f09a下執行:centos

cp contrib/init.d/pbs_server /etc/init.d/pbs_server chkconfig --add pbs_server cp contrib/init.d/pbs_server /etc/init.d/pbs_sched chkconfig --add pbs_sched cp contrib/init.d/pbs_server /etc/init.d/trqauthd chkconfig --add trqauthd

本機便是管理節點也是計算節點:dom

cp ./contrib/init.d/pbs_mom /etc/init.d/ chkconfig --add pbs_mom service pbs_mom start ./torque.setup root qterm -t quick pbs_server qstat -q

三、返回linux根目錄:工具

cd /

進入路徑:/var/spool/torque/server_priv/測試

建立nodes文件:ui

vi nodes

往裏面寫入內容:localhost.localdomain np=1

保存此文件,再reboot命令重啓操做系統。

四、Torque主要是由三個主要部件組成:

(1)pbs_server:PBS服務守護進程,負責接收做業提交,位於服務節點上
(2)pbs_sched:PBS調度守護進程,負責調度做業,位於服務節點上 
(3)pbs_mom:PBS守護進程, 負責監控本機並執行做業,位於全部計算節點上

在單計算機環境下,以上三者均運行在本機。

五、明白了4的意思以後就啓動torque了:

pbs_server pbs_sched pbs_mom trqauthd

六、啓動服務後能夠寫個腳本run.sh測試一下:

#!/bin/sh g++ -o test1 test1.cpp sleep 60 ./test1

能夠在本地隨便寫一個c++代碼test1.cpp,而後命令提交腳本至pbs:

qsub ./run.sh

再使用命令qstat查看:

qstat -a

七、pbs經常使用命令彙總:

qsub提交做業、qstat查看已投運做業的狀況、qdel刪除做業、pnodes查看計算節點資源;
交互模式提交做業,qsub -I;在交互模式中轉發圖形界面,適用於畫圖、有圖形界面的軟件,qsub -I -X;
查看做業運行的節點,qstat -n;查看系統做業隊列劃分狀況(每一個隊列包含的節點、用戶控制),qstat -Qf;
pbs做業腳本經常使用格式:

#PBS -N python_cos_work #PBS -l nodes=1:ppn=2 #PBS -l mem=2G #PBS -l walltime=7200:00:00 #PBS -q batch #PBS -V cd /home/tuzhuo/code/git/pycode/rs python cos.py

pnodes命令查看系統資源,根據系統可用的CPU資源,爲本身的做業合理申請資源;

 

tz@croplab,HZAU

2019/7/26

相關文章
相關標籤/搜索