咱們常常碰見的問題

常常有人問咱們,平常常見問題有哪些,如何解決?您可想象,咱們是全球最大的大型互聯網系統外包服務運營商,因此幾乎碰到過全部問題。程序員

咱們運行各種遊戲、電商、移動通信、廣告、財經、社交活動、旅遊及其它多種網站,因此在各類系統平臺上碰到過各類各樣的問題。在全球十幾個國家有幾百萬用戶,每秒需處理幾千個事務,系統問題及系統崩潰常有發生、避之不及。數據庫

可是,有些共性問題是咱們常常碰到,常常處理的,基本上這些問題能夠歸到一些大的分類,如可靠性問題、系統性能問題、系統擴展問題及系統安全問題。安全

對於可靠性問題,其產生根源衆多,如過載、代碼問題、服務器崩潰、數據庫問題、帶寬、硬件、雲問題、CDN、數據中心問題等。咱們也見證過一些系統更新,還未經完善測試便加以運用所帶來的問題,這些問題是人爲的,由程序員、內容編輯人員、遊戲開發人員甚至是咱們的成員所形成的。服務器

從長遠來看,咱們最大的也是常常碰到的問題即是磁盤空間問題。客戶數量激增、博客量也驟增。無論你提供多大的磁盤空間,爲了處理數據及其它事務,他們會把磁盤空間消耗殆盡。因此,咱們就像其它的系統管理員同樣,竭盡所能,想盡一切辦法增大磁盤、增長存儲空間。所幸的是當今的3TB 磁盤真的很大,可不幸的是數據文件也很大並且採用雲儲存代價很高。因此咱們常常接到此類通知,配合客戶需求,手動或自動清理存儲空間。架構

數據庫問題是一個司空見慣的問題,從過載到常見的複製問題。客戶常常誤解複製、不明白複製需求及複製效果,因此常常產生問題,而咱們也就一直不斷地來解決這些問題,包括使用新型的探測、監控及管理工具使系統正常運行、保證數據準確性。這一工做變得愈來愈重要,由於數據在電子商務及廣告業變得愈來愈關鍵、愈來愈面向財務。併發

其它的可靠性問題還包括PHP, Java 及其它Django問題,固然還包括系統崩潰以及咱們平常監控、管理及解決的問題。特別對於中國而言,咱們天天要處理的主要問題就是帶寬問題,帶寬時而好、時而差、時而又恢復正常。 同時,在中國某些地區,帶寬問題一直存在,前一秒鏈接的很好,後一秒就斷線了。在今天,要恢復鏈接,一般至少要聯繫數據中心、電信部門、還要弄清楚要鏈接什麼和什麼。負載均衡

系統性能問題包括超負荷,就是常見的CPU、RAM 及IO 被大量佔用;不少用戶(有時是同一天同一時間)登陸到客戶網站形成了各類問題。在一望無際的互聯網世界中,可謂事事難料、變幻莫測。ide

常常碰到的問題就是:寫的不好的PHP代碼忽然增長了負載,形成系統CPU不夠;或某些程序佔用空間大,致使RAM不夠;以及SQL不好,沒有索引,使數據庫崩潰,沒法處理併發事件、上鎖甚至是進行輸入輸出操做。工具

系統擴展問題有別於其它問題,爲應付將來幾天、幾周甚至幾個月的事務增加,而需快速創建或擴展系統時,更需另當別論。由於一般狀況下,系統架構時並未考慮此事,負載均衡作的不好,甚至沒有負載均衡,或者是沒有便攜式PHP/Java會話而致使沒法實現均衡。性能

常常有客戶到咱們這裏說,他們的系統遇到「瓶頸」了,前一分鐘還運行的很好,而後,忽然有一天由於過載崩潰了。從理論上說,不該該出現這種狀況,可是,若是使用的監控軟件不好,沒法顯示系統是否接近系統上限的話,那麼這種狀況就會常常發生。不幸的是,系統CPU使用量在95%和100%時,用戶體驗是大相徑庭的:95%時,可能系統運行的有點慢,而在100%時,系統就根本沒法工做。

系統安全一直是一個挑戰,雖然咱們的系統從整體上來講很安全,可是,咱們的客戶使用的代碼不安全,使用的附加工具,如Cpanel 或各種管理界面如PHPMyAdmin 也不安全。因此,咱們一不留神,這些壞蛋就有了可乘之機,有道是:「千里之堤毀於蟻穴。」

所幸的是,咱們的安全是多層次的,並且所分配的權限是最低的,因此,對系統安全的破壞性不多發生。可是,偶爾也會有系統破壞,咱們就必須清理系統,更改受權,增長客戶日誌及安全監控器等等。有時,咱們還作審計工做,查看是否有***存在及其藏匿位置。

最後,咱們常常碰見的問題就是如何節省開支。這不算是技術問題,可是,咱們常常發現客戶在系統及服務器上花費頗多,甚至花過多的冤枉錢。他們會由於系統慢,本身不知道如何解決或調試系統;或者雖然站點功能頗多,可是殊不知道如何將其虛擬化並置於私雲中,因此就採購了許多服務器。

在此,咱們經過調試系統即可以對其進行擴展,而無需購買新系統,或者以更經濟的建立私雲的方式擴展系統,即可爲客戶節省大量開支。


(Authored by Steve Mushero / ChinaNetCloud CEO & CTO  本博客英文原文請點此查看

相關文章
相關標籤/搜索