一、這次使用torque-5.0.0-1_43d8f09a.tar.gz這個版本http://www.adaptivecomputing.com/downloading/?file=/torque/torque-5.0.0-1_43d8f09a.tar.gz,我所使用的linux系統是centos6.5。將torque源碼包下載至linux根目錄下的tmp文件夾,tar -xf命令解壓。並安裝如下編譯工具:node
yum install libtool-devel libxml2-devel openssl-devel gcc gcc-c++ boost-devel
二、cd命令進入解壓後的文件夾torque-5.0.0-1_43d8f09a,切換爲root用戶,逐次運行下列四條命令:python
./configure
make
sudo make install
make packages
最後一條命令會在文件夾內產生下面這些.sh腳本:linux
torque-package-clients-linux-x86_64.sh
torque-package-devel-linux-x86_64.sh
torque-package-doc-linux-x86_64.sh
torque-package-mom-linux-x86_64.sh
torque-package-server-linux-x86_64.shc++
在本機安裝腳本:git
./torque-package-clients-linux-x86_64.sh --install ./torque-package-mom-linux-x86_64.sh --install
在目錄即/tmp/torque-5.0.0-1_43d8f09a下執行:centos
cp contrib/init.d/pbs_server /etc/init.d/pbs_server chkconfig --add pbs_server cp contrib/init.d/pbs_server /etc/init.d/pbs_sched chkconfig --add pbs_sched cp contrib/init.d/pbs_server /etc/init.d/trqauthd chkconfig --add trqauthd
本機便是管理節點也是計算節點:dom
cp ./contrib/init.d/pbs_mom /etc/init.d/ chkconfig --add pbs_mom service pbs_mom start ./torque.setup root qterm -t quick pbs_server qstat -q
三、返回linux根目錄:工具
cd /
進入路徑:/var/spool/torque/server_priv/測試
建立nodes文件:ui
vi nodes
往裏面寫入內容:localhost.localdomain np=1
保存此文件,再reboot命令重啓操做系統。
四、Torque主要是由三個主要部件組成:
(1)pbs_server:PBS服務守護進程,負責接收做業提交,位於服務節點上
(2)pbs_sched:PBS調度守護進程,負責調度做業,位於服務節點上
(3)pbs_mom:PBS守護進程, 負責監控本機並執行做業,位於全部計算節點上
在單計算機環境下,以上三者均運行在本機。
五、明白了4的意思以後就啓動torque了:
pbs_server pbs_sched pbs_mom trqauthd
六、啓動服務後能夠寫個腳本run.sh測試一下:
#!/bin/sh g++ -o test1 test1.cpp sleep 60 ./test1
能夠在本地隨便寫一個c++代碼test1.cpp,而後命令提交腳本至pbs:
qsub ./run.sh
再使用命令qstat查看:
qstat -a
七、pbs經常使用命令彙總:
qsub提交做業、qstat查看已投運做業的狀況、qdel刪除做業、pnodes查看計算節點資源;
交互模式提交做業,qsub -I;在交互模式中轉發圖形界面,適用於畫圖、有圖形界面的軟件,qsub -I -X;
查看做業運行的節點,qstat -n;查看系統做業隊列劃分狀況(每一個隊列包含的節點、用戶控制),qstat -Qf;
pbs做業腳本經常使用格式:
#PBS -N python_cos_work #PBS -l nodes=1:ppn=2 #PBS -l mem=2G #PBS -l walltime=7200:00:00 #PBS -q batch #PBS -V cd /home/tuzhuo/code/git/pycode/rs python cos.py
pnodes命令查看系統資源,根據系統可用的CPU資源,爲本身的做業合理申請資源;
tz@croplab,HZAU
2019/7/26