今天早上7:00開始的從阿里雲虛擬機到物理機的切換(詳見切換至物理機驗證「黑色1秒」是否與虛擬機有關),因爲遭遇阿里雲網絡問題提早結束,14:38更改了DNS解析將流量切換回虛擬機。html
網絡問題是咱們在14:30左右發現的,當時用瀏覽器打不開網站。用Firefox測試,顯示鏈接超時。瀏覽器
Ping發現不少丟包:服務器
780 packets transmitted, 737 packets received, 5.5% packet loss
round-trip min/avg/max/stddev = 9.142/10.310/25.092/1.248 ms
從服務器上的Windows性能監視器看請求量沒有明顯變化,多是部分網絡線路的用戶受影響。咱們用的是上海電信的網絡,用其餘網絡測試,能夠正常訪問。網絡
不知道園子裏有多少朋友受到了這個網絡問題的影響,若是您遭遇了,請諒解由此給您帶來的麻煩!post
咱們經過IIS日誌進一步分析了物理機的網絡狀況。物理機用的是雲服務器的公網網絡,沒有走SLB的網絡。性能
分析的時間段是7:10-14:30,分析的指標是time-taken。time-taken的記錄開始於http.sys接收到來自客戶端的請求的第一個字節,結束於在將響應內容發送給客戶端後,http.sys收到客戶端對最後一個TCP包的ACK或者客戶端重置了TCP鏈接,因此time-taken包含了網絡延遲。測試
【IIS日誌分析狀況】網站
請求總數:9787509(978萬),超過10秒的請求數:25331(佔比0.26%),超過1分鐘的請求數:4058,最長time-taken:545秒(9分鐘)。阿里雲
這個網絡狀況不容樂觀。而若是走SLB,網絡狀況會好不少。url
【物理機測試狀況】
未出現黑色1秒,但因爲觀察時間不夠,不能最終確認。
在物理機上觀察到QPS爲1149時,CPU佔用只有18%(32核)。而在虛擬機上,QPS達800時,CPU就100%(8核)。