從100PV到1億級PV網站架構演變(轉)

http://www.linuxde.net/2013/05/13581.htmlphp

 

一個網站就像一我的,存在一個從小到大的過程。養一個網站和養一我的同樣,不一樣時期須要不一樣的方法,不一樣的方法下有共同的原則。本文結合我自已14年網站人的經歷記錄一些架構演變中的體會。html

積累是必不可少的

架構師不是一天練成的。前端

1999年,我做了一個我的主頁,在學校內的虛擬空間,參加了一次主頁大賽,幾個DREAMWEAVER的頁面,幾個TABLE做佈局,一個DB鏈接,幾行PHP的代碼嵌入在HTML中,再用ftp傳到服務器上就能夠給別人展現一個網站。java

2000年,我的主頁已經不能知足好奇,在當時的網管中心管起幾臺機器,做起網線水晶頭,用ALL PEOPLE SEEMS TO NEED DATA PROCESS的理論開始認識了7層網絡模塊(面試技術員工時,常常會問這些網絡基礎知識的理解)。有了基礎理論的武裝,我也開始配置各類服務來玩Linux,AIX和FreeBSD這些系統。面對各類原理不懂的系統,目的只是想盡辦法去解決網站須要的各類基礎服務。當時搭建了REALSERVER流媒體服務,各類開源FTP下載服務,BATTLENET遊戲網關,APACHE(keepalive等配置,http報頭相關的知識 也是面試的老客戶),DNS,QMAIL等服務給學校的學生使用;mysql

網站有近10萬PV的時候,開始考慮如何做擴展拆分,mysql的MASTER SLAVE做讀寫分離,MYSQL的索引優化是當時惟一會使用的DB性能優化方法。這個階段基本上能解決需求,同時也遇到瓶頸,不知道訪問量再大一個數量級,怎麼辦?明顯感到技術能力不夠。當時受限於網站的量一直沒有新的數量級的突破,致使了幾年內技術工做以維護爲主,體驗着網站平常運維的各類糾結,體力活。而這時期網站的2層架構方法也一再被重複應用到後續的N個網站的搭建過程當中,2001年開始的JSP與php之爭好像對我沒什麼感受,由於我仍是隻會用那種很土的2層架構做着網站:頁面中嵌入JSP,鏈接後端的MYSQL進行數據的CRUD,沒有事務,沒有考慮數據庫讀寫錯誤,沒有考慮兩層系統不可用,由於有問題只須要重啓,有報錯只須要改JSP後刷新頁面。做網站確實是體力活。linux

2005年,在道富參與了FXCNG項目,用MULE ESB,接觸到MULE的前幾個月尚未意識到這個系統在架構中的位置。直到半年後,在與第三方系統集成的應用中,才發現,這樣的一個系統就是傳說中的中間件,他能夠專業的解決一部份系統的職能,好比當時的消息和遠程調用代理。這時候我逐步有了一些架構觀點,一個大型的應用系統中,是須要隔離一部份技術職能,讓系統責任單一,方便技術維護和團隊擴展,專人辦專事。面試

2006年,阿里軟件,一個全新的開始。進入阿里軟件的前三個月在馬總的老家,淘寶的發源地:湖畔花園小區,2樓的4室兩廳裏進行了封閉式開發,很累,但很興奮。這段時間,我參與了一個全新外貿ERP系統的搭建。雖然只做爲一名普通的JAVA開發工程師,僅負責一個很小的模塊開發,但仍是正式體會到一個大型系統的初創過程。這段時間對MVC的架構理論有了深入的理解。MVC三層架構比2層架構帶來的更好的技術擴展與團隊擴展能力讓我映像深入。M層負責DB邏輯的CRUD,架構師們開發出了大量的中間層JAR包,完成了DAO層,DO的封裝,M層也完成了service層,完成了BO的封裝,接口包的封裝,系統使用了最經常使用的工廠、單例、FACACE等模式(直到如今,我面試人仍是經常只會問這些基本的模式)。V層的模板隔離,前端開發能夠在這一層和後端開發一塊兒修改界面(以後,更大規模的團隊連這一層均可以再分離)。C層完成輸入輸出的基本校驗和檢查而後調用後面的服務層功能或做轉發。 簡潔樸素的結構生命力是比較持久的。直到如今,MVC仍是具備很強的生命力,在更種大型網站中承擔重要架構骨架。算法

07年,我對應用層,服務中心層,持久層三層架構並無多少的實踐應用和理解。由於MVC對於初創系統或中小型網站,20人左右的團隊規模來說,已經適用。換個角度看,當時在3個月內做出一個完整的ERP系統也只用使用MVC,再選進的架構也須要考慮網站發展的階段。用戶一邊使用,工程師一邊迭代改進架構,這個方式是做網站,不是傳統應用軟件開發。ERP自己源自傳統應用軟件領域,咱們在用互聯網的方式做管理軟件,最大的挑戰應該是這種邊做邊改進架構的理念。07年,這個理念之爭逐步在團隊內達成了一致,架構師們當心的平衡着業務和架構,這個網站高峯時,也支撐到了日訪問量近千萬的級別,沒有閃架。sql

08年,阿里軟件開放平臺,又是一個新系統。全新的系統架構老是能夠獲得足夠的時間來考慮末來1到3年的增漲。實際上,互聯網系統,咱們感受只能考慮到一年的架構。這一年,我參與架構設計,開始理解了三層架構的價值與擴展能理,服務中心開始搭建,由於這個系統將接受的幾百萬在線的旺旺用戶訪問,因此部份系統開始考慮服務中心,想把業務邏輯聚合到服務層,由統一的團隊進行擴展維護。另外,隨着兩年下來小的業務系統愈來愈多,小機上的oracle鏈接數也吃緊了,服務中心的需求愈來愈大。首先進行的是用戶中心,想法是集成整個集團隊帳號體系,基於『旺號』體系。這個用戶中心項目有個響亮的名字:UDB,項目過程能夠寫一本書。這裏再也不展開。數據庫

《SAAS架構設計》這本書,針對的是軟件平臺的早期ISV用戶。如今的眼光來看,這書寫的過於簡單,正如十年後再來看今天個人寫的這個筆記同樣。

09年,加盟了剛剛成立的aliexpress部門。經歷了兩三個應用的小系統到億級PV的在線交易系統。遇到了不少問題,體會到一個小系統與大網站不一樣階段架構的演變過程有不一樣的難處。

下文從不一樣維度分享億級PV網站架構下個人體會和觀點。

知識結構

網站架構師有不少,有科班出身的,有美術專業的,有生物專業的,有學物理的,有派出所警察出身的,我以爲都是OK的。我也接觸到了這些架構師,很是有特色,在不少技術領域有自已專深的。英雄不問出路,好漢不提當年勇。架構師知識背景能夠不一樣,我的見解是不一樣領域的人做網站架構能夠帶入不少交叉的思路。就像種樹的人再去種花,其實也是能夠看到一些共性的總結抽象。

網站架構師須要有編程的經驗,從基本的算法,經常使用的設計模式,多線程開發,遠程調用,不一樣類型數據源使用,這些是面試的時候看得基本功。我認爲一個資深的測試專家必定是開發高手,一個架構師必須也是有長期的開發經驗,不少性能優化是要從一行行代碼優化起的。試想在一個被調用1000萬次次天天的頁面,一行代碼若是每次都走到,每次少運算1ns,也能夠節省很多的電力。我爲環保做貢獻,我驕傲。

網站架構師須要對網絡環境有很好的知識理解。架構問題是須要考慮網絡部署。好比系統因不可用而發生切換的時候,從一個機房切到另外一個機房,要考慮網站的服務對用戶訪問速度上會有多大影響。這時候的技術方案多是切DNS,也多是切前端的跳起色,或是底層部份服務調用到另外一個機房。對於這類切換的方案,架構師須要計算網絡時間的開銷帶來的QPS影響,和用戶體驗上的延遲,每一個請求估算須要精確到ms級。若是是全球範圍內DNS切換,須要知道DNS刷新的時間經驗週期,好比:全球更新在1小時左右,而80%的地區用戶會在20分鐘內刷新,這樣系統帶來的業務影響會有多大。

網站架構師須要對網絡協議有深刻的理解。HTTP協議是最基礎的,不管是SESSION仍是COOKIE在HTTP協議基礎上怎麼應用,COOKIE的大小,數量,瀏覽器是怎麼處理HTTP協議的。這些基礎有關鍵時候會影響業務的進行。好比,SAFRI瀏覽器對第三方COOKIE是禁用的,某功能跨域寫COOKIE的時候每次都會從新生成COOKIE,直接致使系通通計用戶UV的時候,數量增大,影響各類轉化率的計算。HTTP協議還須要考慮自己的鏈接管理池大小和鏈接是否KEEPALIVE,這些細節不少時候成爲架構上擴展能力的瓶頸。一個靜態頁面服務的HTTP MAXCLIENT設置 爲2500,機器只有10臺,極可能在一次中小型活動中鏈接數到頂,用戶部份請求沒法知足。

架構師須要考慮數據格式帶來的性能影響。不少遠程系統調用走的是HTTP協議爲基礎,數據格式爲純文本或JSON,或XML等,這類調用須要考慮數據的序列化和反序列化,這個工做是CPU開銷型的,對性能優化上須要有針對性。QPS高的系統RT必定會短,但RT短的系統不必定比RT高的系統能表現更好的QPS。

架構師須要有很好的數學能力,計算一個QPS裏系統從網絡請求發出,到網絡的IO時間,DB的磁盤讀寫時間,CPU運算時間,再到數據庫鏈接數,數據分庫分表容量規劃,都須要有精確的計算。由於容量計算不正確帶來問題也是很是多的。好比一臺小機上ORACLE的鏈接數開了2000個,而應用系統因爲不斷的擴展,小業務系統不斷加入,大型促銷活動前,臨時機器的不斷上線,很快就把DB鏈接數用完,引發業務部份不可用。架構師須要去合理估算每種應用的服務能力,以及他對DB等資源的合理鏈接數。

加構師對JVM的內存分區及管理策略要有深刻的瞭解,GC的頻率能夠發現不少系統容量的問題。一個OLD區不斷加大的系統,伴隨YGC高頻發生,加上TCP機器鏈接數極可能高,多是要是機器了。一個業務功能不斷疊加的系統,極可能PERM區會須要加大設置,不然容易OUT OF MEMORY。

加構師須要精讀《數據庫系統概念》這類書,對不一樣DB的索引原理和庫表存儲結構有了解,咱們能夠不是ORACLE ACE,但必定要聽得懂ACE的DB架構和性能優化方面的建議。而且在原則上,前端用戶系統架構上不要出現直連DB的設計,這是億級PV架構的基礎設計保障,特別是一些營銷類功能系統,短時併發大的頁面不能有DB直連,一些小應用可例外對待。

架構師須要很好的學習能力,技術是不斷變化的,昨天用DUBBO,明天可能要換HSF;今天MEMCACHE,明天可能REDIS;今天剛剛把應用拆分,明天可能就要合併。公司外的技術社區還不斷有一些好的開源中間件和框架出來,須要不斷學習,關注。大網站的架構模式不必定合適小網站,新中間件和框架實施須要考慮運維成本和學習推廣成本,架構上要選合適當前階段的。架構師須要和不一樣類型的專業人才溝通,因此要能快速理解並學習不一樣專業的知識去補充自身的知識結構不足。

架構師須要理解業務,在一些業務系統型的網站,業務架構師也顯得異常關鍵,好比像交易型系統,支付型系統。業務架構師須要解決業務層次結構,業務邊界劃分,業務優先級與技術優先級的平衡。傳統軟件的系統分析師不知道是否也幹這角色?但互聯網的業務架構師要求更高,應該是創建在系統架構師的基礎上再看高一層,經過業務和技術的綜合影響力去幫助網站取得合理的架構,更好得拿到業務結果。

網站架構師的知識結構是寬又深的。

設計理念

每一個架構師都會有一些自已原設計理念和原則。個人基本思路是:架構要做到至少1年的預見性(半年不叫預見性,由於方案實施要半年)。設計的目標是儘可能讓系統能夠水平擴展,並利於。固然,有些業務處在生存的邊緣,可能架構方案只有幾個月的生命力。但一些成本不高收益穩定的架構理念,無論何時都是值得優先考慮的。如下是架構設計的一些經常使用手段。

異步換同步

系統中的不少調用是能夠異步化的,包括WEB界面上的AJAX異步,還有服務端的消息型異步;AJAX調用的應用要注意把這種類型的應用集中到一個隔離的服務系統中,以方便在必要的時候進行服務降級。

AJAX調用通常都是界面上非同步非強依賴的功能點;服務端異步的系統可讓服務端的請求RT變短,提高服務器QPS,同時減小應用強依賴。

一個小型系統(峯值萬級消息per second)的服務端異步消息能夠藉助RMDB的表實現,當網站規模變大時(峯值百萬級消息每秒),消息系統須要有一箇中間件,負責消息持久化及數據CRUD管理;再大點的時候,消息中間件的分佈式與可用性會有更高要求,須要綜合使用多種架構設計理念;

同步換異步對軟件工程上的好處是,能夠把一個子系統的不一樣模塊分別由不一樣的人開發維護,調試期間,兩個模塊也不會有很強的依賴。提升開發併發性。

集中變分佈

一個網站小的時候,不少業務都會在一兩個應用系統中實現。好比一個電子商務網站,從登陸,到首頁,到搜索,到產品DETAIL,到購物車,下單支付,風控,訂單管理,用戶中心到售後用戶糾紛流程。網站小的時候,這種一體化的業務架構模式在網站規模小的時候,不管是研發團隊規模仍是硬件成本都是比較低的。這個時期的擴展性通常只須要做到LB後面掛一片集羣。服務器資源利用率這時候也是比較高的。

隨着業務規模擴大,須要把系統獨立分拆出來,基本原則是:不一樣維護策略和服務等級的頁面和服務 不要放在一個應用容器中,最好不要放在一個虛擬機或物理機上。發生過不少次緊急事件。由於大流量頁面上帶着一個小的AJAX請求,把提供AJAX服務的WEB應用壓死。而這種AJAX應用平時又是比較容易在容量評估的時候被忽略的。也比較難以管理AJAX,由於一個前端開發工程師極可能由於一次小的運營活動加上一個調用。服務器端不一樣服務類型的功能也須要分拆到不一樣服務中,服務的聚合必定要有必定的原則,並不斷的調整治理聚合服務內容。若是把一個文件生成類的業務功能(好比用戶批量導入導單)和一個下單的服務放在一塊兒,很容易讓下單這類核心主幹邏輯功能受批量導出功能影響,當架構師須要做服務降級時,不得不侵入代碼層做服務功能的隔離。

架構上的基礎設施也須要有隔離策略。好比一個功能前後須要完成讀數據,再生成文件,再發消息,再寫數據庫,寫CACHE,再把數據同步到另外一個機房。這一串邏輯中,除了異步化策略以外,還須要考慮一些基礎職能的隔離,好比把生成文件的功能封裝成一個服務,文件存儲也須要從集中式變成分佈式。T級能夠考慮NAS類的集中式存儲方案,P級和Z級的文件容量通常是須要考慮分佈式文件系統方案,開源的也比較多。數據庫與從集中式變分佈式是如今流行的方案,以前咱們小網站的時候經常使用MASTER SLAVE,而後再大點搞雙MASTER寫,多SLAVE讀;再大點流量或者應用系統過多時,數據庫的鏈接數也會受到考驗,這時候分佈式的分庫分表方案是必須的。固然對架構師來說,若是能用上一種雲方案,不須要業務架構師考慮分庫分表方案,那會更有幸福感。同步系統也須要考慮集中變分佈的策略,兩個機房或同一機房兩個系統進行數據鏡像同步,須要考慮多通道,分表,分字段,分庫進行同步,有時候還需加入一些商業邏輯做爲同步數據的判斷。非鏡像同步的時候,同步系統還須要考慮業務邏輯之間的事務特性。

 架構層次化

早期網站通常是兩層架構,應用層+數據庫層;如今大型網站常常採用三層架構,應用+服務中心+持久層,這三層分別在不斷的加強可用性和可擴展性;理論上加強後的三層能夠稱爲saas+ paas +iaas。

我把saas層看做如今淘寶開放平臺上的第三方ISV應用,獨立發展,互不影響,SAAS層數據隔離,運維隔離。SAAS層還能夠自建分佈式CACHE,集中式CACHE或簡單的本機CACHE。電子商務網站自己的系統也能夠把這個當成架構設計的目標之一,把自已的應用層做成像第三方APP同樣的存在,這樣發展效率和擴展性都會高很好。

paas層是我理解中的服務中心,具備應用邏輯的一個業務層服務中心,好比UIC用戶中心,IC商品中心,TC交易中心等等 ,通常這樣的一個服務中心會被多個上層SAAS應用所調用依賴。對一隻被一個SAAS應用依賴的服務中心是否值得創建,這個要看投入產出比,通常小網站能夠直接讓應用連着DB,而中型網站也能夠考慮在一個應用內部分爲兩層,先從JAR包層面隔離,PHP的話能夠用代碼目錄結構上來隔離。網站更大規模的時候,1:1的依賴也是值得建服務中心的,由於這樣能夠隔離下面的持久層和上面的應用層,而且能夠在PAAS層隔離考慮緩存等職能,能夠考慮在這一層實現流控,隔離對DB鏈接數量的依賴。PAAS層要儘可能實現自已的水平擴展,服務無狀態。

iaas層負責實現持久層,通常數據源都在這一層,常見網站的數據源不外呼這四種:RMDB(這個玩轉了近20年了),KV(最近10年比較熱,KV能夠分爲內存型或持久型,對於持久型的KV,能夠把數據掛到各種存儲中),inverted index or file(倒排索引類),FILE SYSTEM(各種傳統文件存儲或自已實施的小文件中間件,普通文件中間件)。

這三次之間是1:1:1的關係創建,仍是N:1:1,或是N:N:N,都是需綜合考慮的。曾經有一次,我在設計一個系統的時候,爲應用層界面設計了一個用戶列表的頭像顯示功能就引起了一個調用比例考慮不全的重大問題。當時,用戶有個旺旺的第三方遊戲插件,插件主界面上有個好友列表,每一個好友都有個頭像讀取的請求。假設用戶天天9點左右登陸旺旺的人中會有10%的人立刻去玩這個遊戲,9點左右在線按100萬人算,每一個人的好友有平均50個,則天天9點左右用戶頭像URL的HTTP請求量會有50*10萬,產生近500萬個突發的HTTP請求。雖然有CDN,依然存在很大的頭像請求容量的不足,而且服務端獲取用戶好友列表信息的接口調用併發量也會很大,若是沒有提早對第三方應用進行接口調用限制和設計上的規範化,調用比例極可能帶來極大的系統傷害。

應用層與服務層之間的調用與依賴會隨着網站規模變得愈來愈複雜,當網站小的時候,這兩層直接的固定協議調用是能夠接受的,調用方知道服務端的ip LIST,也知道調用的SOCKET,還有調用的協議;規模更大的時候,調用變成N:N的方式,隨然有層次,但已經成網狀結構,這時候須要服務治理與服務依賴的監控,流控等基礎設施。對於服務治理,引入服務中間件,好比阿里的DUBBO和HSF是比較成熟的能夠處理天天億級的服務調用量並做好配置維護,調用統計,分佈式,名稱服務,流控,路由等基礎職責,業界開源的也有不少;服務層還須要處理異步消息調用與消息通知的機制,這時候需還要配全一些消息中間件。

功能分解化

網站的應用級功能在網站小的時候通常都在一個物理機上,但在網站發展過程當中,有些模塊常常因業務緣由發生變化和升級,有些模塊流量和調用量比較大,有些模塊處理的及時性和異步性要求不一樣,有些模塊與外部調用特別多;有些模塊常常報異常,有些模塊IO多,有些模塊偏CPU計算型。不一樣的模塊須要隨網站規模發展進展不斷的分解。

架構師之道在於庖丁解牛通常的理解業務系統的複雜度和結構關係,進行合適的分解和聚合,這是我理解業務架構的核心貢獻之一。一個業務架構師首先是一個技術架構師,沒有技術背景沒法理解系統內的技術邊界,沒有業務能理沒法預見架構變化的趨勢,也沒法預見業務系統的流量變化。

服務中心化

服務化有不少方式,三層網站架構下,億級PV的網站最好能把同一業務邏輯被多方使用,邊界清楚的功能隔離出來做爲服務。服務中心能夠封裝對持久層的訪問,造成帶有業務邏輯的一種原子性服務,加上一些事務性控制的多個原子服務。服務中心不要有界面,管理好服務的粒度,可用性,高併發下的性能,以及服務路由,監控爲主要任務。

結點監控化

億級PV網站的監控是很是關鍵的,不少系統問題,服務問題,流量問題,性能問題,業務異動都須要經過監控來發現。監控能夠分爲幾類,一類是快照型的,像搞活動的時候特別須要一個大盤監控。能夠看全局的流量,交易量,訪客分佈,來源分佈,系統LOAD,DB鏈接數,CPU和網卡口子的狀態;一類是基線型,能夠看到每小時,分天同一個指標的變化歷史。看到一個頁面響應速度,服務器RT時間的變化;一類是關鍵業務邏輯結點的按需統計,好比須要看一下某頁面改動後某個頁面點擊量和原來的差異。

監控會帶來系統的性能損失,特別是在線打點,無論你是在容器層面做的,仍是在業務邏輯侵入方式實現的;另外一種是經過日誌分析,可能實時性差一些,好比有3分鐘延遲;還有一類是基於RMDB直連的分析,通常會在備庫上把數據導出來做分析,實時性好一些,但對備庫或主庫DB有壓力。還有一類是基於消息的分析來實現監控。讓一些關鍵結點有動做時,發現異步消息到消息隊列上,而後監控系統的抓取模塊和正常 業務邏輯同樣去訂閱消費這些消息。這種方式須要監控團隊與業務邏輯有協同,這對長期運維有挑戰。

基礎架構

億級網站的基礎架構是較多時間投入的一個工做,小網站通常沒有中間件的概念,基礎架構投入精力很少,但同樣能夠運行的很好。對於小網站,DB也像是一箇中間件。一個億級PV的網站,要看PV,也要看UV。這兩個數字的規模對系統的技術架構挑戰點是不一樣的。PV流過的系統和UV通過的系統路徑不一樣,比例可能也有所不一樣。

架構師須要分析這個路徑,比如庖丁解牛般的分析。在合適的節點引入中間件。好比一個億級商品量的系統,須要從商品的POST服務性能,圖片存儲空間,圖片縮圖處理服務,多語言商品信息翻譯,商品信息與圖片在不一樣系統之間同步的服務,圖片CDN服務,商品信息更新的通知和提醒服務,商品搜索服務,商品統計類信息服務等不一樣階段和信息模塊的CRUD中引入中間件,讓系統可擴展,可承受高併發。

在合適的時間點引入中間件提高架構水平擴展能力,只是關心可擴展是不夠的。基礎架構不僅是要關心繫統的可擴展能力,還須要關心可用性。系統達到億級PV後,每停機1分鐘損失的流量都都是很大的。系統架構師預見並規劃好系統容量。對於預料以外的超過容量的PV進行服務降級,限流,針對系統不可用時提供組織保障機制,用提早制定的緊急響應流程讓不可用時間儘量變短,這也是很重要的架構師職責。異地機房容災或是同一機房的系統切換也應該有按期不按期的演習。對於不一樣國家之間的機房災備,系統必須考慮機房之間的調用延遲,國內同步系統通常在10MS以內的延遲是能夠接受的,對於非同步系統,延遲可適當放大,這種延遲的時間須要根據業務特性進行評估。對於中美之間的200ms級別的延遲,系統須要有合理的評估,儘量不要有中美服務同步調用。這個200ms的延遲來自網絡物理傳輸,來自路由器路由算法的延遲,也有來自機房本地的信息號交換過程,是剛性的,不少大型電商網站都面臨這一問題的挑戰。EBAY, AMAZON,alibaba和GOOGLE這類的網站架構設計時,必定會有不少系統不得不討論這一延遲帶來的系統方案區別。有時候網站會因業務緣由考慮建徹底獨立分站,有時候會灰這種架構問題的影響考慮做單寫仍是雙寫。若是是全球機房,則這一問題會變得更復雜。數據同步和分發會是一個關鍵的中間件和可用性設施。

性能是大規模網站的重要基礎架構問題。網站應用層,咱們關心繫統的關鍵頁面的QPS值,好比在100併發下,系統某頁面能接受每秒幾回正常調用;綜合頁面的QPS也是須要關注的,特別是當一個前臺應用內的界面比較多的時候。WEB應用的QPS能夠經過服務端日誌中的COOKIE來回放,進行線上線下的壓測來取得一個有信心的數字。前臺的WEB應用原則上不要有直接的DB層訪問,小規模網站者須要平衡投入產出比,有時候做一些TRADE OFF也是值得的。對於服務層的應用,通常關心TPS,由於調用都來自WEB應用系統,因此經過COOKIE回放這種調用是不可能。持久層的TPS和上兩層的QPS,TPS量之間存在一個比例。多個數據庫的TPS可能對應一個服務層的一個TPS。這對於系統的容量和機器的擴容估主也很是關鍵,須要維護這麼一個狀態的快照。架構師才能讓這個狀態時刻保持成竹在胸。發現關鍵資源瓶頸對於分析QPS和TPS是很是 關鍵的。

服務治理除了做抽應用層服務中心的工做和JAR包之間的依賴管理以外,服務強弱依賴也是須要有一個系統來監控和管理的。隨時知道一個新上的系統在依賴哪一個服務,或被哪一個應用依賴,這是架構師工做的必要工具。架構師從輸出經驗,到提供工具平臺,是一個必然的過程。小網站須要一個架構師的經驗快速搭建,大規模網站則不可能靠一我的的經驗來進行判斷,須要更多的數據採集和分析生成規則。監控系統是一個網站健康狀態的指示儀。

部署架構是網站進入10億級規劃,99.99%可用性要求下必然關注的問題。不管是EBAY仍是AMAZON都在部署上有不少投入。單一的機房因爲電力,機櫃等問題,常常出現部署上的硬件約束;容災與不一樣地區訪問體驗要求異地機房能提供在線同時的服務。部署上須要考慮是全機房的對稱部署,或是應用不一樣分級的分區部署。好比持久層統一,服務層與應用層多機房對稱部署;或是持久層與應用層服務層徹底對稱,但數據分區;這種分區須要考慮買家維度、賣家維度,或是IP區域分區,不一樣區生成的數據經過同步系統實現各區的最終一致。以訂單爲例,分區是可讓美國買家創新的訂單寫在美國分區數據持久層,而後異步消息生成同步任務,數據同步到賣家所在的分區。

基礎架構的工做還有不少,架構師責無龐待。if not me, who?

軟件工程

架構師除了做經驗,工具和代碼輸出以外,還須要關注工做機制的創建和人員的傳幫帶。發佈流程,可重複使用的灰度發佈ABtest方案,代碼管理規範,代碼開發規範,人員梯隊,業務優先級判斷,中間件和平臺化工做推動都是每一天的平常工做。有時候幫測式工程師去搭好並維護一套測試環境,也算是本職工做。

有些架構師被稱爲PM型架構師,也有被感受像RA型的,偏諮詢師型的架構,偏業務型的,偏算法型的,偏性能調優的,偏中間件和服務治理的,偏基礎架構型的,這個是看網站發展階段的須要,缺什麼,做什麼。關鍵是看架構在軟件工程過程當中對產品,對團隊的輸出是否能解決問題,拿到結果!eat what, what strong。

不一樣類型業務系統技術架構的差別化

每一個網站架構都有不一樣,徹底複製是不科學的。哪怕如今想再做一個淘寶網,光靠把淘寶所有幾萬臺機器搬去是不行的,搭不出一個淘寶網。徹底複製淘寶網的建設過程也不是靠譜的。能夠複製或參考的是架構的原則和經驗教訓。不一樣類型的業務系統有不一樣的業務發展過程,業務架構發展演變過程不一樣;技術架構發展過程也不一樣,技術解決問題的重點不一樣,有些網站一開始須要解決的問題是如何從一個老網站中改版和分拆,有些則是全新的搭建。有些網站自建物流系統,有些則是與多家物流第三方對接系統。好比:有些網站交易模式簡單,有些則須要去支持各類不一樣交易模式,像屢次付款,預售,批發,團批,階梯價格。。有些網站只須要解決支付 寶對接,有些則自建網銀與支付系統,風控系統。

架構師要當心經驗的慣性。大網站的方法不必定合適小網站。小網站的格局也不可能適用大規模。時代在變,地點在變,因時制宜,因地制宜。

小趨勢的生命力

開放平臺是胸懷: 06年,咱們都談開放平以。其實這個理念最初考驗的是網站擁有者的胸懷。你是否願意讓其它人進來操做你的數據,是否願意看到別人做出比你理好的應用層系統?甚至是一些服務層的系統?

FB與微博是社會化:07年,咱們都講SNS。SNS無處不在,由於他本質上是一個社會化的思路下的技術系統表示。願意接受UGC,可否以社會化的方式讓系統內的數據產生和管理髮生。原意爲這些社會化的小數據做系統,才能夠最終生成大數據的擁有者。

電商團購是心理:09年,GROUPON火了,你們都團購。團購自己是沒有什麼技術創新的。有人說O2O是他的模式創新,但是,難道在原來的C2C網上不能實現嗎?就像超市裏把促銷的商品放在貨架邊上的花車上,和放在貨架裏有本質區別嗎?區別在於心理,用戶體驗上的區別。有時候這也會是一種竟爭力,是一種常態化的經營思路,但不會主流。

移動PC平板是體驗:10年,平板熱。這種比手機屏大,比筆記本屏小的東西,知足了某些場景的方便性需求,體驗創新頗有機會。

Pinterest電商導購是基尼:11年,導購網站火了。瀑布流熱了,國內的蘑菇街,美麗說火了。從根本上來看,導購是解決 了網站商品與用戶流量之間的基尼關係,把基尼指數變得更小一些。不然80%的流量一直放在20%的熱門商品和大賣家的店裏,市場規模會有影響。做生態圈好一些,有活路的人多了,市場 才穩定。

外貿電商是庫存:12年,外貿電商預熱了,GOOGLE TRENDS裏顯示,才做兩年的ALIEXPRESS的指數超過了DHGATE這個做了五六年跨境電商B2B網站,也愈來愈接近ALIBABA。COM這個老牌SOURCING網站。外貿從批發變小單是什麼背景?我想本質上他的銷售鏈變了。MIC基本還沒變,沒有變成快速反應能力的供應商,但出品商變成了擁有小單外貿客服能力的80後;進口商變成了國外的RETAILER,國外的超市變成了最終消費者。

體感外設是物聯:13年,各種體感設備愈來愈豐富。什麼手勢,什麼隨身拍,什麼位置設備,拍照設備。好玩。按馬斯少理論來說,工做是生存需求,買房子是安全需求,買車和大房子是社交需求,體如今的單位和職位是尊重需求,買體感設備,那是自我實現。

BARABASI預見了末來,小趨勢改變末來的本質是一種叫冪律的無形之手,像咱們所熟知的長尾。聽說人類行爲90%是能夠預測的,人類的90%的形爲是能夠採集的。架構師從不一樣觀察者的角度理解他們的觀點有時候會有更多的預見性。

last BUT NOT THE LEAST

做網站如做人。架構的是人的骨架,人還須要配一個好的心態:心胸+態度。心胸是裝進不一樣聲音採集到信息的基礎,態度是推廣服務他人的手段。一個新架構方案下去,必定會有反對的聲音。如何去說服別人如今就啓動架構升級或轉型方案,是須要帶着心態去的。畢竟一個大的架構方案是須要不少人一塊兒努力才能拿到結果,不是一兩個英雄人物能造就的。架構師的工做方式是主動的,而不是問題驅動的。能解決問題的架構師是牛B的,能預見問題或提早準備的架構師是稱職的,這纔是技術促進業務。

相關文章
相關標籤/搜索