elasticsearch配置

時間 2019-11-25

原文原文鏈接

配置文件詳解1.0版html

配置文件位於es根目錄的config目錄下面，有elasticsearch.yml和logging.yml兩個配置，主配置文件是elasticsearch.yml，日誌配置文件是logging.yml，elasticsearch調用log4j記錄日誌，因此日誌的配置文件能夠按照默認的設置，我來介紹下elasticsearch.yml裏面的選項。node

cluster.name: elasticsearch
配置的集羣名稱，默認是elasticsearch，es服務會經過廣播方式自動鏈接在同一網段下的es服務，經過多播方式進行通訊，同一網段下能夠有多個集羣，經過集羣名稱這個屬性來區分不一樣的集羣。linux

node.name: "Franz Kafka"
當前配置所在機器的節點名，你不設置就默認隨機指定一個name列表中名字，該name列表在es的jar包中config文件夾裏name.txt文件中，其中有不少做者添加的有趣名字。git

node.master: true
指定該節點是否有資格被選舉成爲node（注意這裏只是設置成有資格，不表明該node必定就是master），默認是true，es是默認集羣中的第一臺機器爲master，若是這臺機掛了就會從新選舉master。github

node.data: true
指定該節點是否存儲索引數據，默認爲true。bootstrap

index.number_of_shards: 5
設置默認索引分片個數，默認爲5片。服務器

index.number_of_replicas: 1
設置默認索引副本個數，默認爲1個副本。若是採用默認設置，而你集羣只配置了一臺機器，那麼集羣的健康度爲yellow，也就是全部的數據都是可用的，可是某些複製沒有被分配（網絡

健康度可用 curl 'localhost:9200/_cat/health?v' 查看，分爲綠色、黃色或紅色。綠色表明一切正常，集羣功能齊全，黃色意味着全部的數據都是可用的，可是某些複製沒有被分配，紅色則表明由於某些緣由，某些數據不可用）。併發

path.conf: /path/to/conf
設置配置文件的存儲路徑，默認是es根目錄下的config文件夾。app

path.data: /path/to/data
設置索引數據的存儲路徑，默認是es根目錄下的data文件夾，能夠設置多個存儲路徑，用逗號隔開，例：

path.data: /path/to/data1,/path/to/data2

path.work: /path/to/work
設置臨時文件的存儲路徑，默認是es根目錄下的work文件夾。

path.logs: /path/to/logs
設置日誌文件的存儲路徑，默認是es根目錄下的logs文件夾

path.plugins: /path/to/plugins
設置插件的存放路徑，默認是es根目錄下的plugins文件夾, 插件在es裏面廣泛使用，用來加強原系統核心功能。

bootstrap.mlockall: true
設置爲true來鎖住內存不進行swapping。由於當jvm開始swapping時es的效率會下降，因此要保證它不swap，能夠把ES_MIN_MEM和ES_MAX_MEM兩個環境變量設置成同一個值，而且保證機器有足夠的內存分配給es。同時也要容許elasticsearch的進程能夠鎖住內存，linux下啓動es以前能夠經過`ulimit -l unlimited`命令設置。

network.bind_host: 192.168.0.1
設置綁定的ip地址，能夠是ipv4或ipv6的，默認爲0.0.0.0，綁定這臺機器的任何一個ip。

network.publish_host: 192.168.0.1
設置其它節點和該節點交互的ip地址，若是不設置它會自動判斷，值必須是個真實的ip地址。

network.host: 192.168.0.1
這個參數是用來同時設置bind_host和publish_host上面兩個參數。

transport.tcp.port: 9300
設置節點之間交互的tcp端口，默認是9300。

transport.tcp.compress: true
設置是否壓縮tcp傳輸時的數據，默認爲false，不壓縮。

http.port: 9200
設置對外服務的http端口，默認爲9200。

http.max_content_length: 100mb
設置內容的最大容量，默認100mb

http.enabled: false
是否使用http協議對外提供服務，默認爲true，開啓。

gateway.type: local
gateway的類型，默認爲local即爲本地文件系統，能夠設置爲本地文件系統，分佈式文件系統，hadoop的HDFS，和amazon的s3服務器等。

gateway.recover_after_nodes: 1
設置集羣中N個節點啓動時進行數據恢復，默認爲1。

gateway.recover_after_time: 5m
設置初始化數據恢復進程的超時時間，默認是5分鐘。

gateway.expected_nodes: 2
設置這個集羣中節點的數量，默認爲2，一旦這N個節點啓動，就會當即進行數據恢復。

cluster.routing.allocation.node_initial_primaries_recoveries: 4
初始化數據恢復時，併發恢復線程的個數，默認爲4。

cluster.routing.allocation.node_concurrent_recoveries: 2
添加刪除節點或負載均衡時併發恢復線程的個數，默認爲4。

indices.recovery.max_size_per_sec: 0
設置數據恢復時限制的帶寬，如入100mb，默認爲0，即無限制。

indices.recovery.concurrent_streams: 5
設置這個參數來限制從其它分片恢復數據時最大同時打開併發流的個數，默認爲5。

discovery.zen.minimum_master_nodes: 1
設置這個參數來保證集羣中的節點能夠知道其它N個有master資格的節點。默認爲1，對於大的集羣來講，能夠設置大一點的值（2-4）

discovery.zen.ping.timeout: 3s
設置集羣中自動發現其它節點時ping鏈接超時時間，默認爲3秒，對於比較差的網絡環境能夠高點的值來防止自動發現時出錯。

discovery.zen.ping.multicast.enabled: false
設置是否打開多播發現節點，默認是true。

discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
設置集羣中master節點的初始列表，能夠經過這些節點來自動發現新加入集羣的節點。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

配置文件2.0版

配置文件位於%ES_HOME%/config/elasticsearch.yml文件中，用Editplus打開它，你即可以進行配置。
        全部的配置均可以使用環境變量，例如：
node.rack: ${RACK_ENV_VAR}
        表示環境變量中有一個RACK_ENV_VAR變量。
        下面列舉一下elasticsearch的可配置項：
        1. 集羣名稱，默認爲elasticsearch：
cluster.name: elasticsearch
        2. 節點名稱，es啓動時會自動建立節點名稱，但你也可進行配置：
node.name: "Franz Kafka"
        3. 是否做爲主節點，每一個節點均可以被配置成爲主節點，默認值爲true：
node.master: true
        4. 是否存儲數據，即存儲索引片斷，默認值爲true：
node.data: true
        master和data同時配置會產生一些奇異的效果：
        1) 當master爲false，而data爲true時，會對該節點產生嚴重負荷；
        2) 當master爲true，而data爲false時，該節點做爲一個協調者；
        3) 當master爲false，data也爲false時，該節點就變成了一個負載均衡器。
        你能夠經過鏈接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes，或者使用插件http://github.com/lukas-vlcek/bigdesk或http://mobz.github.com/elasticsearch-head來查看集羣狀態。
        5. 每一個節點均可以定義一些與之關聯的通用屬性，用於後期集羣進行碎片分配時的過濾：
node.rack: rack314
        6. 默認狀況下，多個節點能夠在同一個安裝路徑啓動，若是你想讓你的es只啓動一個節點，能夠進行以下設置：
node.max_local_storage_nodes: 1
        7. 設置一個索引的碎片數量，默認值爲5：
index.number_of_shards: 5
        8. 設置一個索引可被複制的數量，默認值爲1：
index.number_of_replicas: 1
        當你想要禁用公佈式時，你能夠進行以下設置：
index.number_of_shards: 1
index.number_of_replicas: 0
        這兩個屬性的設置直接影響集羣中索引和搜索操做的執行。假設你有足夠的機器來持有碎片和複製品，那麼能夠按以下規則設置這兩個值：
        1) 擁有更多的碎片能夠提高索引執行能力，並容許經過機器分發一個大型的索引；
        2) 擁有更多的複製器可以提高搜索執行能力以及集羣能力。
        對於一個索引來講，number_of_shards只能設置一次，而number_of_replicas可使用索引更新設置API在任什麼時候候被增長或者減小。
        ElasticSearch關注加載均衡、遷移、從節點彙集結果等等。能夠嘗試多種設計來完成這些功能。
        能夠鏈接http://localhost:9200/A/_status來檢測索引的狀態。
        9. 配置文件所在的位置，即elasticsearch.yml和logging.yml所在的位置：
path.conf: /path/to/conf
        10. 分配給當前節點的索引數據所在的位置：
path.data: /path/to/data
        能夠可選擇的包含一個以上的位置，使得數據在文件級別跨越位置，這樣在建立時就有更多的自由路徑，如：
path.data: /path/to/data1,/path/to/data2
        11. 臨時文件位置：
path.work: /path/to/work
        12. 日誌文件所在位置：
path.logs: /path/to/logs
        13. 插件安裝位置：
path.plugins: /path/to/plugins
        14. 插件託管位置，若列表中的某一個插件未安裝，則節點沒法啓動：
plugin.mandatory: mapper-attachments,lang-groovy
        15. JVM開始交換時，ElasticSearch表現並很差：你須要保障JVM不進行交換，能夠將bootstrap.mlockall設置爲true禁止交換：
bootstrap.mlockall: true
        請確保ES_MIN_MEM和ES_MAX_MEM的值是同樣的，而且可以爲ElasticSearch分配足夠的內在，併爲系統操做保留足夠的內存。
        16. 默認狀況下，ElasticSearch使用0.0.0.0地址，併爲http傳輸開啓9200-9300端口，爲節點到節點的通訊開啓9300-9400端口，也能夠自行設置IP地址：
network.bind_host: 192.168.0.1
        17. publish_host設置其餘節點鏈接此節點的地址，若是不設置的話，則自動獲取，publish_host的地址必須爲真實地址：
network.publish_host: 192.168.0.1
        18. bind_host和publish_host能夠一塊兒設置：
network.host: 192.168.0.1
        19. 能夠定製該節點與其餘節點交互的端口：
transport.tcp.port: 9300
        20. 節點間交互時，能夠設置是否壓縮，轉爲爲不壓縮：
transport.tcp.compress: true
        21. 能夠爲Http傳輸監聽定製端口：
http.port: 9200
        22. 設置內容的最大長度：
http.max_content_length: 100mb
        23. 禁止HTTP
http.enabled: false
        24. 網關容許在全部集羣重啓後持有集羣狀態，集羣狀態的變動都會被保存下來，當第一次啓用集羣時，能夠從網關中讀取到狀態，默認網關類型（也是推薦的）是local：
gateway.type: local
        25. 容許在N個節點啓動後恢復過程：
gateway.recover_after_nodes: 1
        26. 設置初始化恢復過程的超時時間：
gateway.recover_after_time: 5m
        27. 設置該集羣中可存在的節點上限：
gateway.expected_nodes: 2
        28. 設置一個節點的併發數量，有兩種狀況，一種是在初始復甦過程當中：
cluster.routing.allocation.node_initial_primaries_recoveries: 4
        另外一種是在添加、刪除節點及調整時：
cluster.routing.allocation.node_concurrent_recoveries: 2
        29. 設置復甦時的吞吐量，默認狀況下是無限的：
indices.recovery.max_size_per_sec: 0
        30. 設置從對等節點恢復片斷時打開的流的數量上限：
indices.recovery.concurrent_streams: 5
        31. 設置一個集羣中主節點的數量，當多於三個節點時，該值可在2-4之間：
discovery.zen.minimum_master_nodes: 1
        32. 設置ping其餘節點時的超時時間，網絡比較慢時可將該值設大：
discovery.zen.ping.timeout: 3s
http://elasticsearch.org/guide/reference/modules/discovery/zen.html上有更多關於discovery的設置。
        33. 禁止當前節點發現多個集羣節點，默認值爲true：
discovery.zen.ping.multicast.enabled: false
        34. 設置新節點被啓動時可以發現的主節點列表（主要用於不一樣網段機器鏈接）：