Elasticsearch入門二

時間 2021-04-01

標籤 java node 服務器架構負載均衡分佈式 code 索引路由同步欄目日誌分析简体版

原文原文鏈接

1、ES基礎概念

1.複雜的分佈式機制，好比分片、副本、負載均衡等等，所有都隱藏起來
2.擴容方案(垂直擴容、水平擴容)
3.增長或者減小節點時的數據rebalance：總有某些服務器的負載會重一些，承載的數量和請求量會大一些
4.mater節點:java

(1)管理es集羣的元數據,好比說索引的建立和刪除,維護索引元數據;節點的增長和移除，維護集羣的元數據
(2)默認狀況下，會自動選擇出一臺節點，做爲mater節點
(3)mater節點不承載全部的請求，因此不會是單點瓶頸

5.節點對等的分佈式架構node

(1)節點對等，每一個節點都能接收全部的請求
(2)節點的自動路由

2、shard和replica機制詳解

index包含多個shard
每一個shard都是一個最小工做單元，承載部分數據
增減節點時，shard會自動的nodes中負載均衡
每一個document只能存在於一個primary shard中。
replica shrad是primary shard的副本，負責容錯以及承擔讀請求負載
primary shard的數量再建立索引的時候就固定了，replica shard的數據能夠隨時更改
replica shard 不能和primary shard放在同一個節點上，可是能夠和別的primary shard的replica shard 放在同一個節點

3、指定index的primary shard的數量

PUT /test_index
    {
        "settings":{
            "number_of_shards":3,
            "number_of_replicas":1
        }
    }

4、容錯的過程

當有一個node宕機，這個機器上的某個primary shard 就沒了，此時status就不是active，狀態也會修改爲red。
(1) 容錯第一步：mater 選舉，自動選擇另外一個node成爲新的mater，承擔起master的責任
(2) 容錯第二步：新的master，將丟失掉的primary shard的某個replica shard提高爲primary shard，此時cluster status會變爲yellow，由於primary shard 所有都變成了active。可是少了一個replica shard,因此不是全部的replica shard 都是active
(3)容錯第三步：重啓故障的node，新的mater會將缺失的副本都時copy一份到該node上，並且該node會使用以前已有的shard數據，只是同步一下宕機以後發生過的修改。cluster status 變爲green。服務器