bsub && lsf 介紹

文章轉載地址:http://www.bbioo.com/lifesciences/40-114265-1.htmlhtml

LSF系統介紹
http://scc.ustc.edu.cn/zh_CN/ 中科大超算中心
http://www.sccas.cn/gb/index.html 中科院超算中心
http://www.ssc.NET.cn/ 上漲超算中心


LSF簡介
LSF(Load Sharing Facility)是分佈資源管理的工具,用來調度、監視、分析聯網計算機的負載。
目的
經過集中監控和調度,充分共享計算機的CPU、內存、磁盤、License等資源
一組安裝了LSF軟件的計算機組成一個Cluster
Cluster內的資源統一監控和調度
LSF Cluster的組成
LSF 術語
Cluster
一組運行LSF軟件的計算機(固然是用TCP/IP網絡互連的),跟計算Cluster術語無關
命令
bhosts 列出cluster中的機器
lsid 顯示cluster名字
lsclusters 顯示cluster狀態和規模
LSF 術語
Server Host
Cluster內提交和執行Job的計算機
Client Host
Cluster內僅僅提交Job的計算機
在科大的Cluster中,node1-node32是ServerHost
LSF 術語
Job
提交給LSF 的命令
LSF負責調度、控制、跟蹤job
命令
bjobs 查看系統的Job
bsub 提交做業
bhist 查看做業歷史
bkill kill一個做業node

相關文章
相關標籤/搜索