它與launchd,daemontools,runit等程序有着相同的功能,與其中某些程序不一樣的是,它並不做爲「id 爲 1的進程」而替代init。相反,它用於控制應用程序,像啓動其它程序同樣,通俗理解就是,把Supervisor服務管理的進程程序,它們做爲supervisor的子進程來運行,而supervisor是父進程。supervisor來監控管理子進程的啓動關閉和異常退出後的自動啓動。html
方便:有些編譯運行的程序,在安裝完成後,須要爲他們編寫啓動中止管理腳本,寫入和維護可能很痛苦,並且進程在異常崩潰結束時,許多程序都不會正確從新啓動的。Supervisord啓動管理的程序進程是做爲其子進程來運行的,而且能夠配置爲在進程崩潰中止時自動從新啓動它們。前端
準確:在Unix上的進程一般很難得到準確的up/down狀態。Pidfiles常常說謊。Supervisord將進程做爲子進程啓動,因此它老是知道其子進程的正確的up/down狀態,能夠方便的對這些數據進行查詢python
進程分組:進程支持分組啓動和中止,也支持啓動順序,即‘優先級’,supervisor容許爲進程分配優先級,並容許用戶經過supervisorctl客戶端發出命令,如「所有啓動」和」從新啓動全部「,它們以預先分配的優先級順序啓動。還能夠將進程分爲」進程組「,一組邏輯關聯的進程能夠做爲一個單元中止或啓動。linux
簡單:supervisor經過簡單的INI風格的配置文件進行配置管理,易於學習,並提供了許多每一個進程選項,如從新啓動失敗的進程和日誌的自動切割。web
集中:supervisor提供一個start、stop和監控進程的地方,進程能夠單獨或分組進行控制。能夠經過supervisor的本地或遠程命令行管理和web管理(通常爲了安全,web一般須要禁用)shell
高效:supervisor經過fork/exec啓動子進程,子進程須要前臺運行,操做系統進程終止時去通知supervisor,而不像一些咱們須要寫腳本去按期輪詢PID文件來從新啓動失敗的進程。bootstrap
可擴展:supervisor有一個簡單的事件(event)通知協議,還有一個用於控制的XML-RPC接口,能夠用Python開發人員來擴展構建。tomcat
兼容:supervisor由Python編寫,在除Windows操做系統之外基本都支持,如linux,Mac OS x,solaris,FreeBSD系統安全
Supervisord:supervisor服務器的進程名是supervisord。它主要負責在本身的調用中啓動子程序,響應客戶端的命令,從新啓動崩潰或退出的進程,記錄其子進程stdout和stderr的輸出,以及生成和處理對應於子進程生命週期中的」event「服務器
服務器進程使用的配置文件,一般路徑存放在/etc/supervisord.confa中。此配置文件是INI格式的配置文件。
supervisorctl:supervisor命令行的客戶端名稱是supervisorctl。它爲supervisord提供了一個相似於shell的交互界面。使用supervisorctl,用戶能夠查看不一樣的supervisord進程列表,獲取控制子進程的狀態,如中止和啓動子進程
web服務器:一個能夠經過Web界面來查看和控制進程的狀態,默認監聽在9091上。
1.安裝
安裝分爲有網絡安裝和無網絡安裝,因爲無網絡安裝環節須要在有網絡的主機上進行依賴包下載,因此相對繁瑣麻煩,若是本機沒有網絡,能夠考慮使用squid代理來進行安裝,本文介紹的是有網絡安裝。
安裝命令可使用easy_install supervisor或者 pip install supervisor 或者去pypi官網上下載最新版本進行解壓安裝。也可使用yum或者apt,但不保證是最新版本。
我這裏使用的是pip方式來安裝。默認系統裏是沒有pip python包管理程序的,先來安裝下pip吧。更新下yum 源
# curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo
下載pip安裝腳本並直接安裝
# curl -o /tmp/get-pip.py https://bootstrap.pypa.io/get-pip.py && python /tmp/get-pip.py
安裝今天的豬腳supervisor程序
# pip install supervisor
2.生成配置文件
用supervisor自帶命令生成一個標準的配置文件
/usr/bin/echo_supervisord_conf > /etc/supervisord.conf
遇到的故障 1:若是在這生成配置文件時,遇到如下故障:
~]# echo_supervisord_conf > /etc/supervisord.conf Traceback (most recent call last): File "/usr/bin/echo_supervisord_conf", line 5, in <module> from pkg_resources import load_entry_point File "/usr/lib/python2.6/site-packages/pkg_resources.py", line 2655, in <module> working_set.require(__requires__) File "/usr/lib/python2.6/site-packages/pkg_resources.py", line 648, in require needed = self.resolve(parse_requirements(requirements)) File "/usr/lib/python2.6/site-packages/pkg_resources.py", line 546, in resolve raise DistributionNotFound(req) pkg_resources.DistributionNotFound: meld3>=0.6.5
解決:檢查你的meld3版本有沒有安裝,另外安裝時,不要使用最新的版本(在本文發表以前一直最新版本是meld3-1.0.2),能夠安裝除1.0.2以前的而且大於0.6.5的版本,使用
pip命令檢查當前的meld3版本,能夠看到當前版本默認安裝了最新版1.0.2
~]# pip list distribute (0.6.10) iniparse (0.3.1) meld3 (1.0.2) pip (9.0.1) pycurl (7.19.0) pygpgme (0.1) setuptools (0.6rc11) supervisor (3.3.1) urlgrabber (3.9.1) yum-metadata-parser (1.1.2)
先卸載當前meld3,以後用pip install 安裝指定版本便可,以下:
~]# pip uninstall meld3 ~]# pip install meld3==1.0.0
而後再運行第1部分處生成配置文件的命令。
本文屬於原創文章,碼字辛苦,轉載前請註明出處,飛走不可:Supervisor: 進程控制系統 http://www.cnblogs.com/hanyifeng/p/6728151.html
3. 這裏穿插下supervisor 和supervisorctl命令使用的配置文件含義
~]# cat /etc/supervisord.conf ; Sample supervisor config file. ; ; For more information on the config file, please see: ; http://supervisord.org/configuration.html ; ; Notes: ; - Shell expansion ("~" or "$HOME") is not supported. Environment ; variables can be expanded using this syntax: "%(ENV_HOME)s". ; - Comments must have a leading space: "a=b ;comment" not "a=b;comment". [unix_http_server] file=/tmp/supervisor.sock ; (socket 文件的路徑) ;chmod=0700 ; socket 文件權限 (default 0700) ;chown=nobody:nogroup ; socket 文件屬主:屬組 ;username=user ; (啓動http的用戶 (open server)) ;password=123 ; (默認的密碼 (open server)) ;[inet_http_server] ; 默認禁用tcp監聽的http 服務 ;port=127.0.0.1:9001 ; (指定監聽在本機ip地址和端口) ;username=user ; (默認啓動http服務的用戶) ;password=123 ; (默認的密碼) [supervisord] logfile=/tmp/supervisord.log ; (主日誌文件的存放位置,默認在程序的工做啓動目錄) logfile_maxbytes=50MB ; (主日誌文件的最大值,以後進行切割;默認 50MB) logfile_backups=10 ; (主日誌文件備份的數目;默認 10) loglevel=info ; (日誌級別;默認是info; 其它: debug,warn,trace) pidfile=/tmp/supervisord.pid ; (supervisord 運行時的pidfile路徑;默認 supervisord.pid) nodaemon=false ; (若是爲true,程序就之前臺運行;默認是 false) minfds=1024 ; (min. 啓動有效的文件描述符數目;默認 1024) minprocs=200 ; (min. 有效進程描述符;默認 200) ;umask=022 ; (進程文件建立的默認權限;默認 022) ;user=chrism ; (默認是當前啓動的用戶) ;identifier=supervisor ; (supervisord 標識符, 默認是'supervisor') ;directory=/tmp ; (默認啓動時間不會切換) ;nocleanup=true ; (在啓動時不清理臨時文件;默認值爲false) ;childlogdir=/tmp ; ('AUTO' 子進程日誌目錄, 默認 $TEMP) ;environment=KEY="value" ; (增長一個環境變量鍵值對:key=」value「) ;strip_ansi=false ; (在log日誌裏去掉ansi轉義編碼; 默認是 false) ; 下面的部分選項必須保留在RPC的配置文件中 ; (supervisorctl/web 接口) 使用如下配置來管理 ; added by defining them in separate rpcinterface: sections [rpcinterface:supervisor] supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface [supervisorctl] serverurl=unix:///tmp/supervisor.sock ; use a unix:// URL for a unix socket ;serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket ;username=chris ; should be same as http_username if set ;password=123 ; should be same as http_password if set ;prompt=mysupervisor ; cmd line prompt (default "supervisor") ;history_file=~/.sc_history ; use readline history if available ; 如下是被管理的示例程序顯示全部可能用到的配置。 ; 建立一個或「多個」程序: 要遵循如下的鍵值對規則。 ; supervisor. ;[program:theprogramname] ;command=/bin/cat ; 程序的啓動命令 (使用絕對路徑) ;process_name=%(program_name)s ; process_name 表示 (默認是 %(program_name)s) ;numprocs=1 ; 啓動時的進程數 (默認 1) ;directory=/tmp ; 執行時切換到的目錄 (def no cwd) ;umask=022 ; umask for process (default None) ;priority=999 ; 相對啓動優先級(default 999) ;autostart=true ; 是否跟隨supervisord程序啓動該監控程序 (default: true) ;startsecs=1 ; # 在設定時間內,程序必須保持運行 (def. 1) ;startretries=3 ; 當啓動失敗時嘗試的最大次數(default 3) ;autorestart=unexpected ; 若是退出後,什麼狀態退出的去重啓,默認非意外的(def: unexpected) ;exitcodes=0,2 ; 'expected' 符合退出代碼以後去重啓 (default 0,2) ;stopsignal=QUIT ; 用於殺死進程的信號 (default TERM) ;stopwaitsecs=10 ; 最大等待秒數 SIGKILL (default 10) ;stopasgroup=false ; 發送中止信號到Unix進程組 (default false) ;killasgroup=false ; SIGKILL UNIX進程組 (def false) ;user=chrism ; setuid to this UNIX account to run the program ;redirect_stderr=true ; 是否開啓程序標準錯誤輸出的重定向 (default false) ;stdout_logfile=/a/path ; 標準輸出路徑; default AUTO ;stdout_logfile_maxbytes=1MB ; 文件最大大小 # 日誌文件進行切割 (default 50MB) ;stdout_logfile_backups=10 ; # 日誌文件備份數目 (default 10) ;stdout_capture_maxbytes=1MB ; ‘捕獲模式’中的字節數 (default 0) ;stdout_events_enabled=false ; 在標準輸出寫入文件時發出事件 (default false) ;stderr_logfile=/a/path ; 標準錯誤輸出, NONE for none; default AUTO ;stderr_logfile_maxbytes=1MB ; 文件最大大小 # logfile bytes b4 rotation (default 50MB) ;stderr_logfile_backups=10 ; # of stderr logfile backups (default 10) ;stderr_capture_maxbytes=1MB ; number of bytes in 'capturemode' (default 0) ;stderr_events_enabled=false ; emit events on stderr writes (default false) ;environment=A="1",B="2" ; 添加進程環境變量 (def no adds) ;serverurl=AUTO ; 覆蓋serverurl計算 (childutils) ;下面是event事件部分全部可能設置的值,大部分同上面同樣。 ; eventlistener subsection values, create one or more 'real' ; eventlistener: sections to be able to handle event notifications ; sent by supervisor. ;[eventlistener:theeventlistenername] ;command=/bin/eventlistener ; the program (relative uses PATH, can take args) ;process_name=%(program_name)s ; process_name expr (default %(program_name)s) ;numprocs=1 ; number of processes copies to start (def 1) ;events=EVENT ; event notif. types to subscribe to (req'd) ;buffer_size=10 ; event buffer queue size (default 10) ;directory=/tmp ; directory to cwd to before exec (def no cwd) ;umask=022 ; umask for process (default None) ;priority=-1 ; the relative start priority (default -1) ;autostart=true ; start at supervisord start (default: true) ;startsecs=1 ; # of secs prog must stay up to be running (def. 1) ;startretries=3 ; max # of serial start failures when starting (default 3) ;autorestart=unexpected ; autorestart if exited after running (def: unexpected) ;exitcodes=0,2 ; 'expected' exit codes used with autorestart (default 0,2) ;stopsignal=QUIT ; signal used to kill process (default TERM) ;stopwaitsecs=10 ; max num secs to wait b4 SIGKILL (default 10) ;stopasgroup=false ; send stop signal to the UNIX process group (default false) ;killasgroup=false ; SIGKILL the UNIX process group (def false) ;user=chrism ; setuid to this UNIX account to run the program ;redirect_stderr=false ; redirect_stderr=true is not allowed for eventlisteners ;stdout_logfile=/a/path ; stdout log path, NONE for none; default AUTO ;stdout_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB) ;stdout_logfile_backups=10 ; # of stdout logfile backups (default 10) ;stdout_events_enabled=false ; emit events on stdout writes (default false) ;stderr_logfile=/a/path ; stderr log path, NONE for none; default AUTO ;stderr_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB) ;stderr_logfile_backups=10 ; # of stderr logfile backups (default 10) ;stderr_events_enabled=false ; emit events on stderr writes (default false) ;environment=A="1",B="2" ; process environment additions ;serverurl=AUTO ; override serverurl computation (childutils) ; The below sample group section shows all possible group values, ; create one or more 'real' group: sections to create "heterogeneous" ; process groups. ;[group:thegroupname] ;programs=progname1,progname2 ; 這裏的progname1,progname2就是定義的監控管理程序的名字,如[program:x]這裏就是x ;priority=999 ; the relative start priority (default 999) ; 下面的 [include] 選項只能包含一個files 設置,功能是定義supervisor管理程序的配置文件,能夠單獨的移除去,和主配置文件分開,方便。
; setting can list multiple files (separated by whitespace or ; newlines). It can also contain wildcards. The filenames are ; interpreted as relative to this file. Included files *cannot* ; include files themselves. ;[include] ;files = relative/directory/*.ini ;定義管理監控程序的配置文件的路徑
4.建立supervisor 存放監控程序的目錄,並修改supervisod.conf文件
~]# mkdir -pv /etc/supervisor/config.d
修改supervisord 主程序文件,能夠
sed -i '$ a [include]' /etc/supervisord.conf sed -i '$ a files = /etc/supervisor/config.d/*.ini' /etc/supervisord.conf
5.而後拷貝如下supervisor程序的 啓動中止控制腳本內容到init.d下,並賦予執行權限。腳本內容以下:
#!/bin/sh # # /etc/init.d/supervisord # # Supervisor is a client/server system that # allows its users to monitor and control a # number of processes on UNIX-like operating # systems. # # chkconfig: - 64 36 # description: Supervisor Server # processname: supervisord # config: /etc/supervisord.conf # pidfile: /var/run/supervisord.pid # Source init functions . /etc/rc.d/init.d/functions prog="supervisord" prefix="/usr/" exec_prefix="${prefix}" prog_bin="${exec_prefix}/bin/supervisord" PIDFILE="/var/run/$prog.pid" start() { echo -n $"Starting $prog: " daemon $prog_bin -c /etc/supervisord.conf --pidfile $PIDFILE [ -f $PIDFILE ] && failure $"$prog startup" || success $"$prog startup" echo } stop() { echo -n $"Shutting down $prog: " [ -f $PIDFILE ] && killproc $prog || success $"$prog shutdown" echo } case "$1" in start) start ;; stop) stop ;; status) status $prog ;; restart) stop start ;; *) echo "Usage: $0 {start|stop|restart|status}" ;; esac
6.設置tomcat的配置文件和guacd的配置文件,存放到以前設置的文件存放目錄/etc/supervisor/config.d/.,
tomcat.ini
#!/usr/bin/python [program:tomcat] command=/usr/share/tomcat/bin/catalina.sh run stdout_logfile=/var/log/tomcat/catalina.out stdout_logfile_maxbytes=20MB autostart=true autorestart=true startsecs=5 priority=3 stopasgroup=true killasgroup=true
guacd.ini
#!/usr/bin/python [program:guacd] command=/usr/local/sbin/guacd -b 0.0.0.0 -l 4822 -p /var/run/guacd.pid -f stdout_logfile=/var/log/guacd/guacd.log stdout_logfile_maxbytes=100MB user=root autostart=true autorestart=true startsecs=5 priority=3 stopasgroup=true killasgroup=true
根據guacd 程序的配置,須要給其建立一個程序的日誌目錄。
~]# mkdir /var/log/guacd
7.將原有的服務,從daemon方式中止掉,並禁止開機自啓動。讓supervisor來管理服務
~]# service tomcat stop ~]# service guacd stop ~]# chkconfig tomcat off ~]# chkconfig guacd off
8.啓動supervisor 程序,
]# /etc/init.d/supervisord start
Starting supervisord: [ OK ]
這時沒問題的話,tomcat服務和guacd服務已經由supervisord父進程來控制了。可使用supervisorctl 客戶端命令來交互檢查服務運行
~]# supervisorctl guacd RUNNING pid 2222, uptime 0:00:08 tomcat RUNNING pid 2223, uptime 0:00:08
也可使用命令行裏試用supervisorctl 來檢查控制被監控進程
~]# supervisorctl status tomcat tomcat RUNNING pid 2223, uptime 0:06:24 ~]# supervisorctl stop tomcat tomcat: stopped ~]# supervisorctl status tomcat tomcat STOPPED Apr 27 05:06 PM
9.測試驗證進程是否自動守護
先檢查下guacd服務的運行狀態
~]# supervisorctl status guacd guacd RUNNING pid 2222, uptime 0:10:23
以後手動殺死該進程
~]# kill 2222
間隔幾秒鐘,程序就會自動啓動該程序。按設定的應該是5秒。能夠設置2~5秒。
~]# supervisorctl status guacd guacd RUNNING pid 2552, uptime 0:06:24
從上面能夠看到,supervisord程序很快的啓動了一個guacd的進程。guacd服務也很快恢復到正常狀態。
supervisor程序的特性就是能夠很好的控制咱們的一些前端運行(不是以dameon方式運行的)的程序,或者說該程序在運行時不穩定,有會被異常殺死的狀況(多是內存泄漏,多是異常崩潰,等其餘問題),經過使用supervisor來管理監控程序的運行,當失敗的時候,自動啓動服務。
文中若有錯誤之處,還望你們及時指出。也歡迎你們在留言區交流哈。
本文屬於原創文章,碼字辛苦,轉載前請註明出處,飛走不可:Supervisor: 進程控制系統 http://www.cnblogs.com/hanyifeng/p/6728151.html
參考連接:
http://supervisord.org/index.html