神祕的偶發服務超時,原因可能是那些壞鄰居

惡鄰A君 唯品會在服務化體系改造的初期,一個對延時敏感的應用,偶然會發生一些超時,事發當時zabbix分鐘級監控,dstat秒級監控的服務器指標都正常,應用,數據庫,緩存,網絡也正常,那這是爲什麼呢? 某天腦洞大開,把懷疑的目光投向了在後臺運行日誌收集程序Flume,發現它的GC運行得比較狂野,於是對它的GC線程數做了限制: 修改前:15分鐘內, 大於30ms的業務調用173次, 大於50ms的2
相關文章
相關標籤/搜索