在若干次前的一場面試,面試官看我作過python
爬蟲/後端 的工做,順帶問了我些後端相關的問題:你以爲什麼是後端?php
送命題。當時腦瓦特了,答曰:邏輯處理和數據增刪改查。。。html
Redis
、
Elasticsearch
和
DNS
等其實都屬於後端知識體系範疇。
在本文中,我將嘗試總結前端須知的後端體系入門。前端
不管你的動機是什麼,這個體系裏都有你想要了解或學習的東西:vue
本文目錄:node
Web / Application Servers
Web Servers
服務器:Web服務器,使用http
協議向Web提供內容。Application Servers
:應用程序服務器,託管並公開業務邏輯和進程。Node.js,Python,PHP,Java,C#
或Ruby
。而事實上,每一個後端語言都有不同的特性,也都有各自的擁護者。哪個語言最適合作爲後端語言的入門一直都是沒有定論的問題。但爲了讓咱們能夠對各語言有一個很簡單的概念,如下整理了各語言較常被說起的特點、在開發上比較被人詬病的點,以及有什麼樣的網站是透過該語言開發的:python
PHP
:nginx
Facebook
、Wordpress
、新浪微博。Java
:git
Linkedin
、Amazon
、淘寶。Ruby
:github
Airbnb
、Twitter
。Python
:web
Instagram
、Reddit
、知乎。JavaScript (Node.js)
:
Yahoo
、Walmart
Go
:
Google
力推,有很完善的標準庫,效能強大堪比C系列。Google
、Youtube
、嗶哩嗶哩、頭條、騰訊雲Web Server
,除了託管自定義應用程序代碼以外,一些Web應用程序體系結構還使用「Web服務器進程」,例如
Apache HTTP Server
或
Nginx
。這些服務器進程將在訪問後端代碼以前攔截客戶端請求。使用它們有如下幾個緣由:
CSS
,JS
)比經過後端代碼訪問更快。PHP
)沒有內置的生產級Web
服務器,所以須要經過專用的Web
服務器進程啓動。至此,會引出一個疑問:Apache
、Nginx
、Tomcat
和Node.js
四者的區別是什麼?
是一類東西,又不是一類東西。
Web服務器
,可是他們關注的點不同。
Tomcat
只能跟 Java
配合,Node.js
只能跟JavaScript
。Apache
能和其餘語言配合(一般跟 PHP
配合居多),但須要藉助不一樣的模塊。Nginx
則是經過端口轉發,因此Apache
和Nginx
能夠和各類編程語言一塊兒使用Nginx
和Apache
是純web
服務器,不具有解析動態語言(好比php文件和js文件)的能力.Tomcat
和Node.js
可以解析這些腳本語言,提供應用服務,Web Server
算是附加的功能。安裝這些工具和後端項目的Web
服務器計算機,自己能夠採用如下幾種形式:
VPS其實是被劃分爲幾個部分的獨立服務器,每一個部分做爲單獨的VPS服務器進行銷售和使用。也就是說,它是一臺可運行多個Web應用程序(網站、軟件等)的相對獨立的機器,每一個用戶擁有部分資源。
VPS
是基於軟件層的虛擬化技術,具體來講就是操做系統的虛擬化,VM
是基於硬件層的虛擬化技術,VM
主機使用vmware server
搭建。
用個類比來極簡說明一下:
1. 物理機是這樣的:
2. 虛擬機是這樣的:
3. Dokcer是這樣的:
Load Balancer
負載均衡是高可用網絡基礎架構的的一個關鍵組成部分,有了負載均衡,咱們一般能夠將咱們的應用服務器部署多臺,而後經過負載均衡將用戶的請求分發到不一樣的服務器用來提升網站、應用、數據庫或其餘服務的性能以及可靠性。
負載平衡器模型一般分爲兩類:第4層(傳輸層)和第7層(應用層)。
第4層(傳輸層)::
第7層(應用層)::
負載均衡器主要分爲硬件負載均衡和軟件負載均衡兩大類。
LVS
、Nginx
和HAproxy
兩種類型的負載平衡器都會收到請求,並根據配置的算法將這些請求分發到特定的服務器。一些行業標準算法是:
Round robin,RR
Weighted round robin,WRB
Least connections
Least response time
在Web
應用程序中使用負載均衡器有兩個主要好處:
Web
服務器不會被全部請求淹沒,來幫助維持一致的響應時間,所以處理每一個請求的速度會相對慢些。DNS
當用戶在其地址欄中輸入URL
時,瀏覽器將獲取URL
的域部分(例如www.google.com
)並調用DNS 。DNS解析發回該網站服務器的IP地址位置(例如172.217.23.4)。一旦它具備IP地址,它就能夠發送對網頁的實際請求。
大多數互聯網域名註冊服務(例如GoDaddy
,萬網等)都提供DNS管理控制檯。這些容許你配置域名(和子域)以指向應用程序的位置。
若是你願意,還能夠將您的域名服務器轉移到阿里雲、騰訊雲等雲提供商,並從那裏進行管理。這樣作的好處是能夠將全部應用程序環境配置保存在一個位置,並使其更易於自動化。
HTTPS / SSL
證書若是你正在構建Web應用程序(或靜態網站),則須要經過HTTPS提供服務,以確保用戶與服務器之間的安全通訊。如今使用HTTPS
也有SEO
的好處,因此沒有理由不使用它。
這意味着須要在後端安裝SSL證書。具體來講,須要在任何服務器上安裝它們,這是客戶端請求的第一個聯繫點。這一般意味着負載均衡器和CDN服務器,但若是你沒有使用負載均衡器,也多是應用程序服務器。
LetsEncrypt
免費生成證書。AWS Certificate Manager
。這容許你建立並自動續訂SSL證書並將其分發到應用程序服務器,負載平衡器和CDN服務器。HTTPS
證書受權中心纔會被瀏覽器認可,不然會顯示爲不安全,須要手動信任。目前SSL證書根據驗證級別分爲三種類型
幾乎全部Web應用程序都須要在某處保留數據。在大多數狀況下,某處即某種形式的數據庫。 數據庫的主要工做是將數據可靠地保存到永久存儲器中,並容許經過查詢檢索數據。它還能夠圍繞它存儲的數據結構強制執行一些規則約束。
早期比較流行的數據庫模型有三種,分別爲層次式數據庫、網絡式數據庫和關係型數據庫。
而在當今的互聯網中,最經常使用的數據庫模型主要是兩種,即關係型(SQL)數據庫和非關係型(NoSQL)數據庫。
MySql,Postgres,SQLServer,Oracle,SQLite
)已經存在了40多年,而且一直是大多數Web應用程序的支柱。你能夠在一臺服務器上託管數據庫,但在生產方案中更常見的是將其託管在某種形式的集羣2臺或更多服務器上。這可確保數據庫具備高可用性並下降數據丟失的風險,例如,若是一臺服務器的存儲損壞。
近年來,少數雲託管的「無服務器數據庫」已經可用。這些是能夠經過API調用的數據庫,但你無需設置服務器來託管它們。除了處理諸如自動備份之類的事情以外,雲供應商還爲您無形地執行此操做。這些示例包括DynamoDB(NoSQL)
,Firebase
實時數據庫(NoSQL
)和Aurora
無服務器(關係)。
不管底層是關係型數據庫,仍是NoSQL數據庫,不管是 Mysql 仍是 Redis、MongoDB,在架構設計上都是相通的。
數據庫服務器的基礎方案分爲三種:
主備式架構是雙機部署中最簡單的一種架構,幾乎市面上全部的數據庫系統都會自帶這個主備功能。
其思路也特別的簡單:
這個架構的優缺點都很明顯,優勢就是幾乎不須要作什麼開發改造,各種數據庫就支持這種模式,部署維護起來也簡單,並無引入額外的系統複雜度和瓶頸。
可是缺點呢,就是當「主機」出現故障的時候,須要人工去幹預啊,運維同窗很辛苦的,並且處理還不必定及時。再還有一個缺點就是,主備架構會形成嚴重浪費資源,畢竟須要一臺與「主機」同等配置的「備機」長期備着,但又不做爲線上服務來使用,你說浪費不浪費。
爲了解決這個資源浪費問題,咱們就得想一個把「備機」也用起來的方案:主從式架構。
主從式架構大致上與上述的主備式架構差很少。區別就是主備式的「備機」平時是不幹活的的,主要起到備份的做用。而主從式的「備機」改成了「從機」,平時也要提供服務,跟「主機」同樣隨時隨刻的在幹活的。
互爲主從的架構是指兩臺機器本身都是主機,而且也都是做爲對方的從機。兩臺機器都提供完整的讀寫服務,所以無需切換,客戶機在調用的時候隨機挑選一臺便可,當其中一臺宕機了,另一臺還能夠繼續服務。
至於數據庫集羣方案,我暫時沒看懂,就不寫了。。。
Blob
/ 文件存儲雖然數據庫一般用於存儲動態數據(例如,由最終用戶或API客戶端生成),可是存在某些類別的數據( 非結構化數據),這些數據不能由用戶改變或者基於文件而不適合數據庫存儲,例如:
Javascript
,CSS
,字體,音頻,視頻文件。雲服務供應商不是將這些存儲在數據庫中,而是提供專用服務來存儲這些服務,例如AWS Simple Storage Service(S3)
,Azure
,Google Cloud Storage
和阿里雲OSS
等。
這樣作的好處是雲供應商能夠安全地存儲文件,並能夠爲其製做冗餘副本,以最大限度地下降數據丟失的風險。
Blob 存儲用於:
Blob
/文件存儲服務容許客戶端經過HTTP
端點訪問文件。例如,您的Web應用程序的HTML標記能夠簡單地連接到AWS S3中存儲的圖像和CSS文件的URL。 傳統網絡訪問:
可是,假設個人用戶位於中國,個人S3存儲位於美國西部 - 數據傳輸距離數千英里,所以個人用戶會看到延遲。
CDN是什麼?使用CDN有什麼優點?
使用了CDN的網站訪問:
CDN
工做流經過權威DNS服務器來實現最優節點的選擇,經過緩存來減小源站的壓力。
Caching Service
雖然CDN
是靜態文件的一種緩存形式,但Web
應用程序可能須要臨時緩存動態數據。
例如,假設存在一個數據庫查詢,該查詢對昨天的數據執行計算,其結果天天常常被成千上萬的用戶訪問。每次用戶請求此數據時聯繫數據庫就沒有任何意義。
對此的解決方案是使用高速緩存服務在第一個用戶請求以後將結果存儲一段時間。經過緩存將更快地提供對該數據的後續請求。
緩存服務本質上是一種特殊類型的數據庫。 緩存採用鍵值存儲的形式,其中鍵是應用程序代碼用於查詢數據的字符串(例如DailySiteStats_2018-10-17),值是緩存的實際數據。緩存的數據一般徹底保存在內存中,這使得從緩存中檢索數據的速度很是快。
常見的緩存服務是Redis
和Memcached
。AWS經過其Elasticache
服務提供這二者的託管版本。
Redis
和Memcached
對比Redis
和Memcached
是都是主流的開源內存數據存儲。雖然它們既易於使用又提供高性能,但在選擇引擎時須要考慮重要的差別。Memcached
是爲簡單而設計的,而Redis
提供了豐富的功能,使其可以普遍用於各類用例。
Memcached | Redis | |
---|---|---|
亞毫秒級延遲 | 是 | 是 |
開發人員易用性 | 是 | 是 |
數據分區 | 是 | 是 |
多語言支持 | 是 | 是 |
高級數據結構 | - | 是 |
多線程架構 | 是 | - |
快照 | - | 是 |
複製 | - | 是 |
發佈/訂閱 | - | 是 |
Lua腳本 | - | 是 |
地理空間支持 | - | 是 |
亞毫秒級延遲:
Redis
和Memcached
都支持亞毫秒的響應時間。經過將數據存儲在內存中,它們能夠比基於磁盤的數據庫更快地讀取數據。
開發人員易用性:
Redis
和Memcached
在語法上都很容易使用,而且須要最少許的代碼才能集成到您的應用程序中。
數據分區:
Redis
和Memcached`都容許您在多個節點之間分發數據。這容許您在需求增加時向外擴展以更好地處理更多數據。
支持普遍的編程語言:
Redis
和Memcached
都有許多面向開發人員的開源客戶端。支持的語言包括Java,Python,PHP,C,C ++,C#,JavaScript,Node.js,Ruby,Go
等等。
高級數據結構:
除了字符串,Redis
還支持列表,集合,有序集,哈希,位數組等。應用程序可使用這些更高級的數據結構來支持各類用例。例如,你可使用Redis排序集輕鬆實現遊戲排行榜,該排行榜保持按其排名排序的玩家列表。
多線程架構:
因爲Memcached
是多線程的,所以它可使用多個處理核心。這意味着您能夠經過擴展計算容量來處理更多操做。
快照:
使用Redis
,您可使用即時快照將數據保存在磁盤上,該快照可用於存檔或恢復。
複製:
Redis
容許您建立Redis
主數據庫的多個副本。這容許您擴展數據庫讀取並具備高可用性集羣。
發佈/訂閱:
Redis
支持使用模式匹配的Pub /Sub
消息傳遞,您能夠將其用於高性能聊天室,實時評論流,社交媒體源和服務器互通。
Lua腳本:
Redis
容許您執行事務性Lua
腳本。腳本能夠幫助您提升性能並簡化應用程序。
地理空間支持:
Redis
具備專門用於大規模處理實時地理空間數據的命令。您能夠執行諸如查找兩個元素(例如人或地點)之間的距離以及查找點的給定距離內的全部元素之類的操做。
適用於批處理任務和分離應用程序的異步消息收發
有時,你程序須要執行的任務與響應用戶請求沒有直接關係。
例如,假設用戶上傳了須要編碼和水印的視頻。但這是一項長期運行的任務,所以讓用戶在完成時等待是沒有意義的。更好的方法是異步執行此操做。您的網絡應用程序代碼會在隊列中建立一條做業消息,並通知您的用戶,當水印視頻準備就緒時,他們將收到一封電子郵件(消息)。
而後,你將擁有一個能夠執行如下操做的工做任務流:
這裏有2個架構組件:
您能夠經過如下幾種方式實現worker
任務:
CRON
做業以觸發應用程序服務器上安裝的指定代碼,以便按特定計劃從隊列中讀取。FaaS
平臺調用工做器代碼。消息隊列是一種異步的服務間通訊方式,適用於無服務器和微服務架構。消息在被處理和刪除以前一直存儲在隊列上。每條消息僅可被一位用戶處理一次。消息隊列可被用於分離重量級處理、緩衝或批處理工做以及緩解高峯期工做負載。
如今經常使用的MQ組件有activeMQ
、rabbitMQ
、rocketMQ
、zeroMQ
還有近年來火熱的kafka
,從某些場景來講也是MQ,固然kafka的功能更增強大,雖然不一樣的MQ都有本身的特色和優點,可是,無論是哪一種MQ,都有MQ自己自帶的一些特色。
特性 | 說明 |
---|---|
推送或拉取傳送 | 拉取是指不斷查詢隊列以獲取新消息。推送是指系統在有可用消息時通知用戶 (也稱爲發佈/訂閱消息收發)。您還可使用長輪詢讓拉取等待指定的時間,以便新消息在完成以前到達。 |
定時或延遲傳送 | 支持爲消息設置特定的傳送時間。若是須要爲全部消息設置相同延遲,能夠設置一個延遲隊列。 |
至少一次傳送 | 消息隊列能夠存儲多個消息副本以實現冗餘和高可用性,並在發生通訊故障或錯誤的狀況下從新發送消息,以確保它們至少通過一次傳送。 |
確切一次傳送 | 在不允許重複的狀況下,FIFO (先進先出) 消息隊列會經過自動篩選重複來確保每一個消息均精確地傳輸了一次 (且只有一次)。 |
FIFO (先進先出) 隊列 | 在這些隊列中,首先接受處理的是最先的 (或第一個) 條目,有時稱爲「隊首」。 |
消息優先級 | 一般狀況下,您能夠爲消息分配優先級,以肯定要在隊列中添加該消息的位置,從而確保優先級較高的消息位於隊列前端並獲得優先處理。 |
咱們的實際場景大概是一個基於微服務架構的電商系統,分爲用戶微服務、商品微服務、訂單微服務、促銷微服務等。
基於微服務模式開發的系統,MQ的使用場景更多。這裏咱們就列舉一下常見的應用示例。
註冊後咱們可能須要作不少初始化的操做,如:
後臺發佈商品的時候:
elasticsearch
)MQ
,而後經過監聽MQ
來生成elasticsearch
對應的數據。用戶下單後,24小時未支付,須要取消訂單。
逛國外社區看到這篇,以爲挺簡潔明瞭的。
只是以爲好玩,就按其大綱,重寫總結一下,有說錯的地方多擔待。
意思就是寫得略粗糙,別噴我。。。
若是你以爲這篇內容對你挺有啓發,我想邀請你幫我三個小忙:
也能夠來個人GitHub
博客裏拿全部文章的源文件:
前端勸退指南:github.com/roger-hiro/…