這個是雲服務器,配置高的驚人,測試的機子居然和正式的機子如出一轍,只實現了web和數據庫分離的構架
維持了3個月,因爲物理機故障,3臺服務器同時掛掉,網站暫停服務至少一天web
master-slave:
仍是雲服務器,配置仍是高的驚人, 除了另外一個機房實現了web備份和數據庫主從外,跟第一階段沒什麼差異
由於一次數據庫服務器數據頁面錯誤,主庫崩潰,web和數據庫跨機房了數據庫
master-master
上一次的教訓是數據庫修復的時候,發現master的數據必須從slave導出來...數據一致性的要求.
痛定思痛,決定上雙master-master,這個時候出現了一個應用層的悲劇,就是多個項目要公用一部分表了,而web卻在另在兩個服務器上 期間爲了解決衝突,把自增id給岔開了服務器
這個階段最大的悲劇在同一個機房內,web+數據庫沒有備份的,在某次攻擊後,悲劇的發現,web+數據必須切換到那個備份的機房去了運維
還在進行中...svn
推動太困難了,通過2次事故..我有點不想繼續既作開發又作運維的了...出現問題的時候你們說,我不知道啊,服務器不歸我管理,我怎麼操做呢?要講解運維思路的時候你們又不積極測試
得出的最大教訓就是:雲服務器太不穩定了,要以數量取勝,不能同一機櫃。有一次別人的雲服務器被攻擊,提供商居然重啓了物理機..而後又諸多悲劇出現網站
最大的感恩就是:學到了不少知識。每次事故服務器我都要被迫親自參與修復,原本不那麼熟悉的,一會兒被強迫作了不少事情code
最近這段時間開始測試的東西有:中間件
Fabric
已經上線使用,Atlas
上線遙遙無期..不少坑等待被發現crontab
今天由於到期,來不及續費,還剩下10個小時的時間,服務器居然自動關機了...還好,是關機而已,不是刪除服務器....坑啊
今天新增長2臺服務器,準備內網使用,中國的帶寬真TMD的貴.並非每臺都能10M出口帶寬的..
由於沒有統一的上傳文件和圖片,每一個服務器都把圖片上傳到本身那臺,最近要考慮怎麼把這些圖片整合起來了,由於圖片量比較少,因此準備了一下方案:
不知道你們還有其它方案麼?難點在於多臺服務器之間相互rsync...
再次重申雲服務器的好處:新開服務器幾乎是1小時之內,而後,必定要以數量取勝...
今天同一個物理盤所在的雲盤上可能有人大量寫入數據...致使同一個機櫃上的N個機子云盤io 100%... 之前對雲主機都沒怎麼認識,今天真是大開眼界了...
雲盤和雲主機,另外一個大坑就是:天佑同機櫃和同物理機的的人都正正當當,否則,通常的人都不知道問題出在哪裏