《ElasticSearch6.x實戰教程》之準備工做、基本術語

時間 2020-06-03

標籤 elasticsearch6.x elasticsearch 實戰教程準備基本術語欄目日誌分析简体版

原文原文鏈接

第一章-準備工做

關注公衆號：CoderBuff，回覆「es」獲取《ElasticSearch6.x實戰教程》完整版PDF。html

工欲善其事必先利其器git

ElasticSearch安裝

ElasticSearch6.3.2下載地址（Linux、mac OS、Windows通用，下載zip包便可）：https://www.elastic.co/cn/downloads/past-releases/elasticsearch-6-3-2。ES歷史版本下載頁面：https://www.elastic.co/cn/downloads/past-releases#elasticsearch。程序員

在正式安裝前，你須要確保你的系統已配置JDK8環境。github

mac OS

在上述下載地址下載完elasticsearch-6.3.2.tar.gz後，首先在當前登陸用戶的home下建立一個Settings目錄，經過tar -zxvf elasticsearch-6.3.2.tar.gz解壓到當前目錄。數據庫

進入elasticsearch-6.3.2.tar.gz目錄，執行./bin/elasticsearch命令，等待一小段時間，經過瀏覽器訪問http://localhost:9200/?pretty出現如下響應：json

{              
    "name": "x4x7wWJ",              
    "cluster_name": "elasticsearch",              
    "cluster_uuid": "sJ6LTYJ1TDmtR1kzl0M2Ig",              
    "version": {              
        "number": "6.3.2",              
        "build_hash": "8bbedf5",              
        "build_date": "2017-10-31T18:55:38.105Z",              
        "build_snapshot": false,              
        "lucene_version": "6.6.1"              
    },              
    "tagline": "You Know, for Search"              
}

Linux

Linux的安裝過程和Linux相同。瀏覽器

ES須要使用普通用戶安裝、啓動，若是你是root用戶，須要先建立一個用戶，用普通用戶而不是root用戶啓動ES。app

第二章-基本術語

白馬非馬elasticsearch

ES是一個搜索引擎，同時它也是一個分佈式文檔存儲數據庫（固然是非關係型的）。爲了保證後續的實戰教程順利進行，這裏經過對比傳統的關係型數據庫MySQL介紹在ES中的一些術語。分佈式

在MySQL中共有數據庫（Database）、表（Table）、記錄（Row）、列（Column）的概念，一樣在ES中也有相似的概念，索引（Index），類型（Type），文檔（Document），字段（Field）。

能夠這麼理解：

	數據庫	表	記錄	列
MySQL	DB	Table	Row	Column
ES	Index	Document	Document	Field

索引Index

ES中的索引概念可不是關係型數據庫中的「索引」，ES中的索引指的是存儲數據的地方，相似關係型數據庫中的數據庫概念。

類型Type

有的文章指出ES中的類型Type對應的就是關係型數據庫中的表，在使用ES中咱們會遇到另一個概念映射（Mapping），也有很多的文章指出Mapping對應的就是關係型數據庫中的表。關係型數據庫中表與表是物理獨立的，即便在兩個表中存在相同名稱不一樣類型的列，這在咱們的關係型數據庫也是極爲合理的，但這在ES中就不合理，ES中即便是在同一個索引Index下，若是字段Field存在於不一樣的類型Type中，即便他們表明不一樣的含義，可是隻要它們的名稱相同也必需要求類型相同，在ES中類型Type對應於關係型數據庫中表的概念已經名不副實。實際上在ES中Type做爲表的概念在後期版本中愈來愈被弱化，在未被ES正式移除前，ES後期版本已經不容許一個索引Index建立多個Type，相信在後面的版本會完全移除類型Type。

（注：ES6已經不容許一個Index建立多個Type，https://github.com/elastic/elasticsearch/pull/24317）

若是在現階段必定要理解ES中的Type，那麼必定要和Mapping結合起來。能夠理解爲類型Type就是定義一個表，僅僅是定義而已，而映射Mapping定義了表結構（有哪些列，列的類型是什麼）。

文檔Document

在非關係型數據庫中，有部分被稱之爲「文檔數據庫」，對應於關係型數據庫中的一行記錄。

字段Field

對應關係型數據庫中的列。

節點

一個ES實例稱之爲一個節點，單機部署的ES有且只有一個節點，集羣部署的ES有多個節點且有一個主節點。

分片

ES可做爲分佈式集羣部署，一樣也能夠做爲單機單節點部署。ES中的數據被分散存儲在分片中，ES屏蔽了底層的分片實現，咱們直接與索引交互而不與分片交互。分片數量的多少與是不是集羣部署和單機部署無關，即便是單機部署在建立索引時仍然也能夠指定劃分多個分片（默認5個主分片1份備份（包含5個備分片））。分片有主分片和備分片之分，顧名思義，備分片是主分片的備份，當主分片出現故障時，備份片充當主分片。

對於單機部署

單機部署的ES，即表示ES有且只有一個節點，在建立索引時，若是不指定主分片與備分片的數量，默認建立5個主分片和1份備份（5個備分片），實際上對於單機部署的ES服務來說，多個主分片並無意義，多個分片存在的意義自己就是將數據分散存儲到多個ES節點中進行同時查詢，此時只有一個節點多個分片也沒有意義。備分片在單機部署中一樣也沒有意義，備份存在的意義自己就是當主分片故障時，仍然能對外提供服務，此時主備都在一個節點上，若是主分片故障，備分片也一樣會致使故障。

對於集羣部署

對於集羣部署的ES來說，此時存在多個節點，主分片的分配與備分片機制就顯得尤其重要（這涉及查詢性能以及服務高可用），例如如今有3個節點，此時若是在建立索引時只分配1個主分片就顯得有點浪費（注：主分片一旦在建立索引時肯定便不能修改）。主分片的劃分並無必定放之四海而皆準的規則，更多的是取決於用戶的數據量以及ES節點數量等。一般所理解的是，分片數量越多越好，由於這能將數據分散到不一樣分片，以便之後在擴容新增節點時，ES能將自動將分片從新進行均勻分佈。但這條理論也不絕對，若是你的節點只有3個，設置了100個分片，每一個節點就有33個節點，當搜索請求調度到同一節點的不一樣分片時，此時會引起硬件資源（CPU）的搶奪，形成性能問題。反過來，若是3個節點只分配了3個分片，隨着業務的發展，數據量愈來愈大，單個分片已不能承受它最大的數據量，此時就算新增節點，可是分片數量只有3個，分片的數量在建立索引時便肯定且不可修改，此時只能經過從新建立索引。

既要對合理的數據增加有一個判斷（規劃較大的分片），又要對指望有一個度的把握（合理的分片數量）。官方給出了一點建議，每一個分片的數據量最好是在20G~40G左右，這就意味着若是你有4個節點，數據量預估在200G左右甚至更大，此時分片數量設置爲5~10個比較合適，七、8個差很少，每一個節點有2個分片。（官方博客的建議，https://www.elastic.co/cn/blog/how-many-shards-should-i-have-in-my-elasticsearch-cluster）

上面談到的是主分片，副分片的劃分也同等重要。若是不對分片備份，主分片故障則致使數據丟失，部分數據不可查詢。副本分片設置過多形成額外的存儲空間，默認狀況下，建立索引時會建立一個分片副本（一個分片副本不表明一個備分片，若是有5個主分片，那麼分片副本就有5個備分片，同理若是指定建立兩個分片副本，此時一共就有10個備分片。）須要注意的是備分片是能夠修改的，因此備分片能夠直接採用默認一個分片副本。

關注公衆號：CoderBuff，回覆「es」獲取《ElasticSearch6.x實戰教程》完整版PDF。

<div align="center">這是一個能給程序員加buff的公衆號（CoderBuff）</div> <div align="center"><img src="https://img2018.cnblogs.com/blog/630246/201907/630246-20190717223740465-1981496921.png" /></div>

原文出處：https://www.cnblogs.com/yulinfeng/p/11204169.html