分佈式與集羣的區別是什麼?



在IDF05(Intel Developer Forum 2005)上,Intel首席執行官Craig Barrett就取消4GHz芯片計劃一事,半開玩笑當衆單膝下跪致歉,給廣大軟件開發者一個明顯的信號,單純依靠垂直提高硬件性能來提升系統性能的時代已結束,分佈式開發的時代實際上早已悄悄地成爲了時代的主流,吵得很熱的雲計算實際上只是包裝在分佈式以外的商業概念,不少開發者(包括我)都想加入研究雲計算這個潮流,在google上經過「雲計算」這個關鍵詞來查詢資料,查到的都是些概念性或商業性的宣傳資料,其實真正須要深刻的仍是那個早以被人熟知的概念------分佈式。web

分佈式可繁也能夠簡,最簡單的分佈式就是你們最經常使用的,在負載均衡服務器後加一堆web服務器,而後在上面搞一個緩存服務器來保存臨時狀態,後面共享一個數據庫,其實不少號稱分佈式專家的人也就停留於此,大體結構以下圖所示:算法

這種環境下真正進行分佈式的只是web server而已,而且web server之間沒有任何聯繫,因此結構和實現都很是簡單。數據庫

有些狀況下,對分佈式的需求就沒這麼簡單,在每一個環節上都有分佈式的需求,好比Load Balance、DB、Cache和文件等等,而且當分佈式節點之間有關聯時,還得考慮之間的通信,另外,節點很是多的時候,得有監控和管理來支撐。這樣看起來,分佈式是一個很是龐大的體系,只不過你能夠根據具體需求進行適當地裁剪。按照最完備的分佈式體系來看,能夠由如下模塊組成:編程

  1. 分佈式任務處理服務:負責具體的業務邏輯處理
  2. 分佈式節點註冊和查詢:負責管理全部分佈式節點的命名和物理信息的註冊與查詢,是節點之間聯繫的橋樑
  3. 分佈式DB:分佈式結構化數據存取
  4. 分佈式Cache:分佈式緩存數據(非持久化)存取
  5. 分佈式文件:分佈式文件存取
  6. 網絡通訊:節點之間的網絡數據通訊
  7. 監控管理:蒐集、監控和診斷全部節點運行狀態
  8. 分佈式編程語言:用於分佈式環境下的專有編程語言,好比Elang、Scala
  9. 分佈式算法:爲解決分佈式環境下一些特有問題的算法,好比解決一致性問題的Paxos算法

所以,若要深刻研究雲計算和分佈式,就得深刻研究以上領域,而這些領域每一塊的水都很深,都須要很底層的知識和技術來支撐,因此說,對於想提高技術的開發者來講,以分佈式來做爲切入點是很是好的,能夠以此爲線索,探索計算機世界的各個角落。緩存

集羣是個物理形態,分佈式是個工做方式。

只要是一堆機器,就能夠叫集羣,他們是否是一塊兒協做着幹活,這個誰也不知道;一個程序或系統,只要運行在不一樣的機器上,就能夠叫分佈式,嗯,C/S架構也能夠叫分佈式。

集羣通常是物理集中、統一管理的,而分佈式系統則不強調這一點。

因此,集羣可能運行着一個或多個分佈式系統,也可能根本沒有運行分佈式系統;分佈式系統可能運行在一個集羣上,也可能運行在不屬於一個集羣的多臺(2臺也算多臺)機器上。

分佈式是相對中心化而來,強調的是任務在多個物理隔離的節點上進行。中心化帶來的主要問題是可靠性,若中心節點宕機則整個系統不可用,分佈式除了解決部分中心化問題,也傾向於分散負載,但分佈式會帶來不少的其餘問題,最主要的就是一致性。
服務器

集羣就是邏輯上處理同一任務的機器集合,能夠屬於同一機房,也可分屬不一樣的機房。分佈式這個概念能夠運行在某個集羣裏面,某個集羣也可做爲分佈式概念的一個節點。
微信

一句話,就是:「分頭作事」與「一堆人」的區別
網絡

分佈式是指將不一樣的業務分佈在不一樣的地方。 而集羣指的是將幾臺服務器集中在一塊兒,實現同一業務。

分佈式中的每個節點,均可以作集羣。 而集羣並不必定就是分佈式的。

舉例:就好比新浪網,訪問的人多了,他能夠作一個羣集,前面放一個響應服務器,後面幾臺服務器完成同一業務,若是有業務訪問的時候,響應服務器看哪臺服務器的負載不是很重,就將給哪一臺去完成。

而分佈式,從窄意上理解,也跟集羣差很少, 可是它的組織比較鬆散,不像集羣,有一個組織性,一臺服務器垮了,其它的服務器能夠頂上來。

分佈式的每個節點,都完成不一樣的業務,一個節點垮了,哪這個業務就不可訪問了。

2:簡單說,分佈式是以縮短單個任務的執行時間來提高效率的,而集羣則是經過提升單位時間內執行的任務數來提高效率。

例如:

若是一個任務由10個子任務組成,每一個子任務單獨執行需1小時,則在一臺服務器上執行該任務需10小時。

採用分佈式方案,提供10臺服務器,每臺服務器只負責處理一個子任務,不考慮子任務間的依賴關係,執行完這個任務只需一個小時。(這種工做模式的一個典型表明就是Hadoop的Map/Reduce分佈式計算模型)

而採用集羣方案,一樣提供10臺服務器,每臺服務器都能獨立處理這個任務。假設有10個任務同時到達,10個服務器將同時工做,1小時後,10個任務同時完成,這樣,整身來看,仍是1小時內完成一個任務!

集羣通常被分爲三種類型,高可用集羣如RHCS、LifeKeeper等,負載均衡集羣如LVS等、高性能運算集羣;分佈式應該是高性能運算集羣範疇內。

分佈式:不一樣的業務模塊部署在不一樣的服務器上或者同一個業務模塊分拆多個子業務,部署在不一樣的服務器上,解決高併發的問題
架構

集羣:同一個業務部署在多臺機器上,提升系統可用性
併發

小飯店原來只有一個廚師,切菜洗菜備料炒菜全乾。後來客人多了,廚房一個廚師忙不過來,又請了個廚師,兩個廚師都能炒同樣的菜,這兩個廚師的關係是集羣。爲了讓廚師專心炒菜,把菜作到極致,又請了個配菜師負責切菜,備菜,備料,廚師和配菜師的關係是分佈式,一個配菜師也忙不過來了,又請了個配菜師,兩個配菜師關係是集羣


BLOG地址www.liangsonghua.com

關注微信公衆號:松花皮蛋的黑板報,獲取更多精彩!

公衆號介紹:分享在京東工做的技術感悟,還有JAVA技術和業內最佳實踐,大部分都是務實的、能看懂的、可復現的

相關文章
相關標籤/搜索