linux運維工程師工做中的一些常見問題解決方法

http://blog.sina.com.cn/s/blog_b9fe247a0101anoe.htmlhtml

1.shell腳本死活不執行mysql

問題:某天研發某同事找我說幫他看看他寫的shell腳本,死活不執行,報錯。我看了下,腳本很簡單,也沒有常規性的錯誤,報「: bad interpreter: No such file or directory」錯。一linux

看這錯,我就問他是否是在windows下編寫的腳本,而後在上傳到linux服務器的……果真。sql

緣由:在DOS/Windows裏,文本文件的換行符爲rn,而在*nix系統裏則爲n,因此DOS/Windows裏編輯過的文本文件到了*nix裏,每一行都多了個^M。shell

解決:1)從新在linux下編寫腳本;2)vi :% s/r//g :% s/^M//g (^M輸入用Ctrl+v, Ctrl+m)windows

 

2.crontab輸出服務器

問題:/var/spool/clientmqueue目錄佔用空間超過100G網絡

緣由:cron中執行的程序有輸出內容,輸出內容會以郵件形式發給cron的用戶,而sendmail沒有啓動因此就產生了/var/spool/clientmqueue目錄下的那些文件,日積月累可能撐破磁盤。memcached

解決:1)直接手動刪除:ls |xargs rm -f ; 2)完全解決:在cron的自動執行語句後加上 >/dev/null 2>&1測試

 

3.telnet很慢

問題:某天研發某同事說10.50訪問10.52memcached服務異常,讓咱們檢查下看網絡/服務/系統是否有異常。檢查發現系統正常,服務正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同時發現該機器的namesever是不起做用的。

緣由:because your PC doesn’t do a reverse DNS lookupon your IP then… when you telnet/ftp into your linux box, it’ll do a dns lookupon you。

解決:1)修改/etc/hosts使hostname和ip對應; 2)在/etc/resolv.conf註釋掉nameserver或者找一個「活的」nameserver。

 

4.Read-onlyfile system

問題:同事在mysql裏建表建不成功,提示以下:

mysql>create table wosontest (colddname1 char(1));

ERROR 1005 (HY000): Can’t create table ‘wosontest’ (errno: 30)

經檢查mysql用戶權限以及相關目錄權限沒問題;用perror 30提示信息爲:OS error code 30: Read-only file system

可能緣由:1)文件系統損壞;2)磁盤又壞道;3)fstab文件配置錯誤,如分區格式錯誤錯誤(將ntfs寫成了fat)、配置指令拼寫錯誤等。

解決:1)因爲是測試機,重啓機器後恢復;2)網上說用mount可解決。

 

5.文件刪了磁盤空間沒釋放

問題:某天發現某臺機器df -h已用磁盤空間爲90G,而du -sh /*顯示全部使用空間加起來才30G,囧。

緣由:可能某人直接用rm刪除某個正在寫的文件,致使文件刪了但磁盤空間沒釋放的問題

解決:1)最簡單重啓系統或者重啓相關服務。

2)幹掉進程

/usr/sbin/lsof|grep deleted

ora 25575 data 33u REG 65,65 4294983680 /oradata/DATAPRE/UNDOTBS009.dbf(deleted)

從lsof的輸出中,咱們能夠發現pid爲25575的進程持有着以文件描述號(fd)爲 33打開的文件/oradata/DATAPRE/UNDOTBS009.dbf。在咱們找到了這個文件以後能夠經過結束進程的方式來釋放被佔用的空間:echo > /proc/25575/fd/33

3)刪除正在寫的文件通常用 cat /dev/null > file

 

6.find文件

問題:在tmp目錄下有大量包含picture_*的臨時文件,天天晚上2:30對一天前的文件進行清理。以前在crontab下跑以下腳本,可是發現腳本效率很低,每次執行時負載猛漲,影響到其餘服務。

#!/bin/sh

find /tmp -name 「picture_*」 -mtime +1 -exec rm -f {} ;

緣由:目錄下有大量文件,用find很耗資源。

解決:

#!/bin/sh

cd /tmp

time=`date -d 「2 day ago」 「+%b %d」`

ls -l|grep 「picture」 |grep 「$time」|awk ‘{print $NF}’|xargs rm -rf

 

7.獲取不了網關mac地址

問題:從2.14到3.65(映射地址2.141)網絡不通,可是從3端的其餘機器到3.65網絡OK。

緣由:

# arp

Address HWtype HWaddress Flags Mask Iface

192.168.3.254 ether incomplet CM bond0

表面現象是機器自動獲取不了網關MAC地址,網絡工程師說是網絡設備的問題,具體不清。

相關文章
相關標籤/搜索