【轉】搜索引擎選擇： Elasticsearch與Solr

時間 2019-11-12

標籤搜索引擎選擇 elasticsearch solr 欄目搜索引擎简体版

原文原文鏈接

原文地址：http://i.zhcy.tk/blog/elasticsearchyu-solr/git

Elasticsearch簡介

Elasticsearch是一個實時的分佈式搜索和分析引擎。它能夠幫助你用史無前例的速度去處理大規模數據。github

它能夠用於全文搜索，結構化搜索以及分析，固然你也能夠將這三者進行組合。web

Elasticsearch是一個創建在全文搜索引擎 Apache Lucene™ 基礎上的搜索引擎，能夠說Lucene是當今最早進，最高效的全功能開源搜索引擎框架。算法

可是Lucene只是一個框架，要充分利用它的功能，須要使用JAVA，而且在程序中集成Lucene。須要不少的學習瞭解，才能明白它是如何運行的，Lucene確實很是複雜。數據庫

Elasticsearch使用Lucene做爲內部引擎，可是在使用它作全文搜索時，只須要使用統一開發好的API便可，而不須要了解其背後複雜的Lucene的運行原理。apache

固然Elasticsearch並不只僅是Lucene這麼簡單，它不但包括了全文搜索功能，還能夠進行如下工做:json

分佈式實時文件存儲，並將每個字段都編入索引，使其能夠被搜索。服務器
實時分析的分佈式搜索引擎。網絡
能夠擴展到上百臺服務器，處理PB級別的結構化或非結構化數據。架構

這麼多的功能被集成到一臺服務器上，你能夠輕鬆地經過客戶端或者任何你喜歡的程序語言與ES的RESTful API進行交流。

Elasticsearch的上手是很是簡單的。它附帶了不少很是合理的默認值，這讓初學者很好地避免一上手就要面對複雜的理論，

它安裝好了就可使用了，用很小的學習成本就能夠變得頗有生產力。

隨着越學越深刻，還能夠利用Elasticsearch更多高級的功能，整個引擎能夠很靈活地進行配置。能夠根據自身需求來定製屬於本身的Elasticsearch。

使用案例：

維基百科使用Elasticsearch來進行全文搜作並高亮顯示關鍵詞，以及提供search-as-you-type、did-you-mean等搜索建議功能。
英國衛報使用Elasticsearch來處理訪客日誌，以便能將公衆對不一樣文章的反應實時地反饋給各位編輯。
StackOverflow將全文搜索與地理位置和相關信息進行結合，以提供more-like-this相關問題的展示。
GitHub使用Elasticsearch來檢索超過1300億行代碼。
天天，Goldman Sachs使用它來處理5TB數據的索引，還有不少投行使用它來分析股票市場的變更。

可是Elasticsearch並不僅是面向大型企業的，它還幫助了不少相似DataDog以及Klout的創業公司進行了功能的擴展。

Elasticsearch的優缺點:

優勢

Elasticsearch是分佈式的。不須要其餘組件，分發是實時的，被叫作」Push replication」。
Elasticsearch 徹底支持 Apache Lucene 的接近實時的搜索。
處理多租戶（multitenancy）不須要特殊配置，而Solr則須要更多的高級設置。
Elasticsearch 採用 Gateway 的概念，使得完備份更加簡單。
各節點組成對等的網絡結構，某些節點出現故障時會自動分配其餘節點代替其進行工做。

缺點

只有一名開發者（當前Elasticsearch GitHub組織已經不僅如此，已經有了至關活躍的維護者）
還不夠自動（不適合當前新的Index Warmup API）

Solr簡介

Solr（讀做「solar」）是Apache Lucene項目的開源企業搜索平臺。其主要功能包括全文檢索、命中標示、分面搜索、動態聚類、數據庫集成，以及富文本（如Word、PDF）的處理。Solr是高度可擴展的，並提供了分佈式搜索和索引複製。Solr是最流行的企業級搜索引擎，Solr4 還增長了NoSQL支持。

Solr是用Java編寫、運行在Servlet容器（如 Apache Tomcat 或Jetty）的一個獨立的全文搜索服務器。 Solr採用了 Lucene Java 搜索庫爲核心的全文索引和搜索，並具備相似REST的HTTP/XML和JSON的API。Solr強大的外部配置功能使得無需進行Java編碼，即可對其進行調整以適應多種類型的應用程序。Solr有一個插件架構，以支持更多的高級定製。

由於2010年 Apache Lucene 和 Apache Solr 項目合併，兩個項目是由同一個Apache軟件基金會開發團隊製做實現的。提到技術或產品時，Lucene/Solr或Solr/Lucene是同樣的。