tar命令高級用法——備份數據

Linux上有功能強大的tar命令,tar最初是爲了製做磁帶備份(tape archive)而設計的,它的做用是把文件和目錄備份到磁帶中,而後從磁帶中提取或恢復文件。如今咱們可使用tar來備份數據到任何存儲介質上。它是文件級備份,沒必要考慮底層文件系統類別,而且支持增量備份。html

部分經常使用選項

  • -z, --gzip:使用gzip工具(解)壓縮,後綴通常爲.gz
  • -c, --create:tar打包,後綴通常爲.tar
  • -f, --file=:後面馬上接打包或壓縮後獲得的文件名
  • -x, --extract:解包命令,與-c對應
  • -p:保留備份數據的本來權限和屬性
  • -g:後接增量備份的快照文件
  • -C:指定解壓縮的目錄
  • --exclude:排除不打包的目錄或文件,支持正則匹配

其餘linux

  • -X, --exclude-from:在一個文件中列出要排除的目錄或文件(在--exclude=較多時使用)
  • -t, --list:列出備份檔案中的文件列表,不與-c-x同時出現
  • -j, --bzip2:使用bzip2工具(解)壓縮,後綴通常爲.bz2
  • -P:保留絕對路徑,解壓時一樣會自動解壓到絕對路徑下
  • -v:(解)壓縮過程顯示文件處理過程,經常使用但不建議對大型文件使用

增量備份(網站)數據

許多系統(應用或網站)天天都有靜態文件產生,對於一些比較重要的靜態文件若是有進行按期備份的需求,就能夠經過tar打包壓縮備份到指定的地方,特別是對一些總文件比較大比較多的狀況,還能夠利用-g選項來作增量備份。服務器

備份的目錄最好使用相對路徑,也就是進入到須要備份的根目錄下網絡

具體示例方法以下。工具

備份當前目錄下的全部文件
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/data01.tar.gz .

在須要恢復的目錄下解壓恢復
# tar -zxpf /tmp/data01.tar.gz -C .

-g選項能夠理解備份時給目錄文件作一個快照,記錄權限和屬性等信息,第一次備份時/tmp/snapshot_data.snap不存在,會新建一個並作徹底備份。當目錄下的文件有修改後,再次執行第一條備份命令(記得修改後面的檔案文件名),會自動根據-g指定的快照文件,增量備份修改過的文件,包括權限和屬性,沒有動過的文件不會重複備份。網站

另外須要注意上面的恢復,是「保留恢復」,即存在相同文件名的文件會被覆蓋,而原目錄下已存在(但備份檔案裏沒有)的,會依然保留。因此若是你想徹底恢復到與備份文件如出一轍,須要清空原目錄。若是有增量備份檔案,則還須要使用一樣的方式分別解壓這些檔案,並且要注意順序。設計

下面演示一個比較綜合的例子,要求:code

  • 備份/tmp/data目錄,但cache目錄以及臨時文件排除在外
  • 因爲目錄比較大(>4G),因此全備時分割備份的檔案(如每一個備份檔案文件最大1G)
  • 保留全部文件的權限和屬性,如用戶組和讀寫權限
# cd /tmp/data

作一次徹底備份
# rm -f /tmp/snapshot_data.snap
# tar -g /tmp/snapshot_data.snap -zcpf - --exclude=./cache ./ | split -b 1024M - /tmp/bak_data$(date -I).tar.gz_
分割後文件名後會依次加上aa,ab,ac,...,上面最終的備份歸檔會保存成
bak_data2014-12-07.tar.gz_aa
bak_data2014-12-07.tar.gz_ab
bak_data2014-12-07.tar.gz_ac
...

增量備份
能夠是與徹底備份如出一轍的命令,但須要注意的是假如你一天備份屢次,可能致使檔案文件名重複,那麼就會致使
備份實現,由於split依然會從aa,ab開始命名,若是一天的文件產生(修改)量不是特別大,那麼建議增量部分不
分割處理了:( 必定要分割的話,文件名加入更細緻的時間如$(date +%Y-%m-%d_%H) )
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-07.tar.gz --exclude=./cache ./

次日增備
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-08.tar.gz --exclude=./cache ./

恢復過程htm

恢復徹底備份的檔案文件
能夠選擇是否先清空/tmp/data/目錄
# cat /tmp/bak_data2014-12-07.tar.gz_* | tar -zxpf - -C /tmp/data/

恢復增量備份的檔案文件
$ tar –zxpf /tmp/bak_data2014-12-07.tar.gz -C /tmp/data/
$ tar –zxpf /tmp/bak_data2014-12-08.tar.gz -C /tmp/data/
...
必定要保證是按時間順序恢復的,像下面文件名規則也可使用上面通配符的形式

若是須要按期備份,如每週一次全備,天天一次增量備份,則能夠結合crontab實現。教程

備份文件系統

備份文件系統方法有不少,例如cpio, rsync, dump, tar,這裏演示一個經過tar備份整個Linux系統的例子,整個備份與恢復過程與上面相似。
首先Linux(這裏是CentOS)有一部分目錄是不必備份的,如/proc/lost+found/sys/mnt/media/dev/proc/tmp,若是是備份到磁帶/dev/st0則沒必要關心那麼多,由於我這裏是備份到本地/backup目錄,因此也須要排除,還有其它一些NFS或者網絡存儲掛載的目錄。

建立排除列表文件
# vi /backup/backup_tar_exclude.list
/backup
/proc
/lost+found
/sys
/mnt
/media
/dev
/tmp

$ tar -zcpf /backup/backup_full.tar.gz -g /backup/tar_snapshot.snap --exclude-from=/backup/tar_exclude.list /

注意

使用tar不管是備份數據仍是文件系統,須要考慮是在原系統上恢復仍是另外一個新的系統上恢復。

  • tar備份極度依賴於文件的atime屬性,
  • 文件所屬用戶是根據用戶ID來肯定的,異機恢復須要考慮相同用戶擁有相同USERID
  • 備份和恢復的過程儘可能不要運行其餘進程,可能會致使數據不一致
  • 軟硬鏈接文件能夠正常恢復

參考


原文連接地址:http://seanlook.com/2014/12/08/tar_backup_filesystem/

相關文章
相關標籤/搜索