實戰網絡故障

        這個星期蠻忙的,星期二和星期三要協助安全產品的廠商測試。星期三快下班的時候,公司的整個網絡出現了問題,變得很是緩慢,內部的應用基本癱瘓。沒辦法,又得出演消防員這個角色了
        有問題,到機房!第一時間來到了機房,在監控機上看了一下,網絡使用率打到60%-80%,怪不到卡死了。後悔啊,沒把那個監控交換機和路由器的軟件掛着,看不到以前的數據,惟有使用最原始的方法判斷問題所在了。先簡單介紹一下公司的網絡拓撲,核心交換機下有七臺智能交換機,智能交換機下鏈接非智能的交換機,實現了多主機的接入。初步判斷是主機或者是非智能交換機的問題。要快速定位故障,用了插拔法。分別把每一個智能交換機到核心交換機的端口斷開,一分鐘內就找出了出現故障的交換機。
       故障定位了,就處處理的階段了。把問題的交換機連上,登錄上去,先把登錄外的其餘端口所有down掉。而後,查看日誌,或許是由於出現了故障的緣由,交換機上的日誌只有登錄後down掉端口的信息,其餘的都沒了。怎麼辦?不急,咱們再來查看一下每一個端口的狀態,看一下每一個端口的錯誤報告和數據包的狀況。48個端口一個個看,來了,來了,其中有幾個端口廣播包特別多,有一個更多到「瘋狂」的地步,43億!!!要是我有這麼多人民幣就行了!哈哈!先把可能有問題的端口記下來,把其餘沒問題的端口開啓,沒問題,好的!可能有問題的端口一個一個開,43億的那個最後開。前幾個都沒問題,43億的那個一上來就有問題了。立馬把它down掉,而後到現場查線。順藤摸瓜,終於找到了問題所在。一個非智能交換機上有一條線的兩頭都插在交換機上面的,造成環路,形成大量廣播,致使網絡癱瘓。把那個線拔下來,端口再up起來。沒問題了!!現場的狀況是非智能交換機的端口有多的,並且是掛在牆腳附近,比較低,並且網線到位了,電腦沒所有到位,有多的網線,就連到桌面上放在那裏,估計是那裏的人看到有一根網線的水晶頭掉到地上,看到交換機上有口,順手就插上去了,好心幹了壞事。
        此次故障是解決了,可是也給了我提醒,監控軟件要用好,掛在那裏,有問題了能夠準肯定位。工做上要學習的事情還多呢。努力啊!
相關文章
相關標籤/搜索