Tsar介紹ios
Tsar是淘寶的一個用來收集服務器系統和應用信息的採集報告工具,如收集服務器的系統信息(cpu,mem等),以及應用數據(nginx、swift等),收集到的數據存儲在服務器磁盤上,能夠隨時查詢歷史信息,也能夠將數據發送到nagios報警。nginx
Tsar可以比較方便的增長模塊,只須要按照tsar的要求編寫數據的採集函數和展示函數,就能夠把自定義的模塊加入到tsar中。git
Tsar安裝
github
Tsar目前託管在github上,下載編譯安裝步驟:sql
$git clone git://github.com/kongjian/tsar.git $cd tsar $make $make install
安裝後:數據庫
定時任務配置:/etc/cron.d/tsar
,負責每分鐘調用tsar執行採集任務;swift
日誌文件輪轉配置:/etc/logrotate.d/tsar
,每月會把tsar的本地存儲進行輪轉;服務器
Tsar配置文件路徑:/etc/tsar/tsar.conf
,tsar的採集模塊和輸出的具體配置;tcp
模塊路徑:/usr/local/tsar/modules
,各個模塊的動態庫so文件;ide
Tsar配置
Tsar剛安裝完,尚未歷史數據,想要check是否正常,執行tsar -l,查看是否有實時信息輸出:
Tsar的配置主要都在/etc/tsar/tsar.conf
中,經常使用的有:
增長一個模塊,添加 mod_<yourmodname> on
到配置文件中
打開或者關閉一個模塊,修改mod_<yourmodname> on/off
output_stdio_mod
可以配置執行tsar時的輸出模塊
output_file_path
採集到的數據默認保存到的文件(若是修改的話須要對應修改輪轉的配置/etc/logrotate.d/tsar
)
output_interface
指定tsar的數據輸出目的,默認file保存本地,nagios/db輸出到監控中心/數據庫中,這兩個功能還須要結合其它配置,具體見後面
Tsar使用
查看歷史數據,tsar
-l/--list 查看可用的模塊列表
-l/--live 查看實時數據,tsar -l --cpu
-i/--interval 指定間隔,歷史,tsar -i 1 --cpu
--modname 指定模塊,tsar --cpu
-s/--spec 指定字段,tsar --cpu -s sys,util
-d/--date 指定日期,YYYYMMDD或者n表明n天前
-C/--check 查看最後一次的採集數據
-d/--detail 可以指定查看主要字段仍是模塊的全部字段
-h/--help 幫助功能
高級功能
輸出到nagios
配置: 首先配置output_interface file,nagios
,增長nagios輸出
而後配置nagios服務器和端口,以及發送的間隔時間
####The IP address or the host running the NSCA daemon server_addr nagios.server.com ####The port on which the daemon is running - default is 5667 server_port 8086 ####The cycle of send alert to nagios cycle_time 300
因爲是nagios的被動監控模式,須要指定nsca的位置和配置文件位置
####nsca client program send_nsca_cmd /usr/bin/send_nsca send_nsca_conf /home/a/conf/amon/send_nsca.conf
接下來指定哪些模塊和字段須要進行監控,一共四個閥值對應nagios中的不一樣報警級別
####tsar mod alert config file ####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax; threshold cpu.util;50;60;70;80;
輸出到Mysql
配置: 首先配置output_interface file,db
,增長db輸出
而後配置哪些模塊數據須要輸出
output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io
而後配置sql語句發送的目的地址和端口
output_db_addr console2:56677
目的地址在該端口監聽tcp數據,而且把數據入庫便可,能夠參照 tsar2db。
模塊開發
Tsar的一個比較好的功能是可以增長本身的採集,這時候須要編寫模塊代碼,編譯成so文件便可。
首先安裝tsardevel,剛纔安裝時,若是執行make tsardevel
,就會把模塊開發的基本文件安裝到系統 而後執行tsardevel ,就能在當前模塊生成一個模塊目錄:
[kongjian@v132172.sqa.cm4 tsar]$ tsardevel test build:make install:make install uninstall:make uninstall [kongjian@v132172.sqa.cm4 tsar]$ ls test Makefile mod_test.c mod_test.conf
按照要求修改mod_test.c中的read_test_stats,set_test_record 完成後make;make install就完成新模塊的配置文件和so的設置,執行tsar --test就能查看效果。
另外也能夠經過配置文件對自定義模塊傳遞參數,方法是修改配置文件中的mod_test on myparameter
而後在mod_test.c中的read_test_stats函數中,經過parameter參數就能夠得到剛纔配置文件中的內容。
使用:
tsar命令行主要擔負顯示歷史數據和實時數據的功能,所以有控制展現模塊和格式化輸出的參數,默認不帶任何參數/選項的狀況下,tsar打印彙總信息。
tsar命令行主要顯示給人看的,因此數據展現中都進行了k/m/g等的進位。
tsar命令會在顯示20行數據後再次打印各個列的列頭,以利於用戶理解數據的含義。
tsar的列頭信息包括2行,第一行爲模塊名,第二行爲列名。
tsar輸出最後會做min/avg/max的彙總統計,統計所展現中的最小/平均/最大數據。
--help/-h 顯示提示信息和模塊信息
[like@mmdev5]tsar -h Usage: tsar [options] Options: --cron/-c run in cron mode, output data to file --interval/-i specify intervals numbers, in minutes if with --live, it is in seconds --list/-L list enabled modules --live/-l running print live mode, which module will print --ndays/-n show the value for the past days (default: 1) --merge/-m merge multiply item to one --help/-h help Modules Enabled: --swap swap usage --partition Disk and partition usage --cpu CPU share (user, system, interrupt, nice, & idle) --mem Physical memory share (active, inactive, cached, free, wired) --traffic Net traffic statistics --load System Run Queue and load average --tcp TCP traffic (v4) --udp UDP traffic (v4) --tcpx TCP connection data --pcsw Process (task) creation and context switch
--live/-l 啓用實時模式,相似iostat等,能夠配合-i參數和模塊參數使用。
--interval/-i 控制時間間隔,在打印歷史數據中,單位是分鐘,默認顯示間隔5分鐘;而實時模式(-l)下,單位是秒,默認是5秒。
--ndays/-n 控制顯示多長時間的歷史數據,默認1,單位天
--merge/-m 對有多個數據的展現,進行彙總,如機器上跑了3個squid,能夠用 tsar --squid -m的放式進行展現彙總。
--cron 用於cron運行tsar採集功能。
常見用法列表:
tsar -i 1 -l 以1秒鐘爲間隔,實時打印tsar的概述數據
[like@mmdev5 conf]$ tsar -i 1 -l Time ---cpu-- ---mem-- ---tcp-- -----traffic---- --sda--- ---load- Time util util retran pktin pktout util load1 13/05-18:44 0.5 18.4 0.0 75.0 525.0 3.3 0.1 13/05-18:44 0.4 18.4 0.0 93.0 544.0 0.0 0.1
tsar 顯示1天內的歷史彙總(summury)信息,以默認5分鐘爲間隔
tsar --cpu -i 1 顯示一天內cpu的歷史信息,以1分鐘爲間隔
tsar --live --mem -i 2 以2秒鐘爲間隔,實時打印mem的數據。
tsar --cpu --mem -i 1 顯示一天內的cpu和內存歷史數據,以1分鐘爲間隔。