04 Apache Solr: 目錄結構

     經過前面的介紹,咱們已經可以看到管理員界面並對Solr造成了一個感性的認識。本篇將在物理上深刻了解Solr的安裝目錄結構和Solr示例的主目錄結構。
 

安裝目錄結構

  Solr 6.3.0安裝文件夾裏面包含不少內容。這裏挑選一些重要的目錄進行說明。目錄結構以下:web

  • bin:大量的Solr控制檯管理工具存在該目錄下。例如前面提到的solr\solr.cmd\post等。
    • contrib:該文件包含大量關於Solr的擴展。分別以下:
    • analysis-extras:該目錄下面包含一些相互依賴的文本分析組件。
    • clustering:該目錄下有一個用於集羣檢索結果的引擎。
    • dataimporthandler:DIH是Solr中一個重要的組件,該組件能夠從數據庫或者其餘數據源導入數據到Solr中。
    • dataimporthandler-extras:這裏麪包含了對DIH的擴展。
    • extraction:集成Apache Tika,用於從普通格式文件中提取文本。
    • langid:該組件使得Solr擁有在建索引以前識別和檢測文檔語言的能力。
    • map-reduce:提供一些和Hadoop Map-Reduce協同工做的工具。
    • morphlines-cell:爲Solr Cell類型的功能提供Kite Morphlines的特性。
    • morphlines-core:爲Solr提供Kite Morphlines的特性。
    • uima:該目錄包含用於集成Apache UIMA的庫。
    • velocity:包含一個基於Velocity模板語言簡單檢索UI框架。
  • dist:在這裏能找到Solr的核心JAR包和擴展JAR包。當咱們試圖把Solr嵌入到某個應用程序的時候會用到核心JAR包。
    • solrj-lib:包含構建基於Solr的客戶端時會用到的JAR包。
    • test-framework:包含測試Solr時候會用到的JAR包。
  • docs:該文件夾裏面存放的是Solr文檔,離線的靜態HTML文件,還有API的描述。可是我的以爲不是太有用,使用Solr Reference Guide更好。
  • example:包含Solr的簡單示例。在其中的exampledocs子文件夾下存放着前面提到過的用於在Windows環境下發送文檔到Solr的工具post.jar程序。
  • licenses:各類許可和協議。
  • server:在本地把Solr做爲服務運行的必要文件都存放在這裏。
    • contexts:啓動Solr的Jetty網頁的上下文配置。
    • etc:Jetty服務器配置文件,在這裏能夠把默認的8983端口改爲其餘的。
    • lib:Jetty服務器程序對應的可執行JAR包和響應的依賴包。
    • logs:默認狀況下,日誌將被輸出到這個文件夾。
    • modules:http\https\server\ssl等配置模塊。
    • resources:存放着Log4j的配置文件。這裏能夠改變輸出日誌的級別和位置等設置。
    • scripts:Solr運行的必要腳本。
    • solr:運行Solr的配置文件都保存在這裏。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的時候有用。子文件夾/configsets存放着Solr的示例配置文件。
    • solr-webapp:前面已經提到過的管理界面的站點就存放在這裏。
    • tmp:存放臨時文件。

主目錄結構

     前面提到過,若是啓動的Solr實例不是示例中的一個,那麼咱們須要建立Core,這樣才能順利的完成索引的建立和查詢過程。每建立一個Core,都會產生一個對應的文件夾,這個文件夾就是這裏要提到的主目錄,也是未來使用Solr的過程當中會常常操做到的一類目錄。須要說明的是,在「獨立模式」和「雲模式」下,主目錄的結構是有些許差別的。
     獨立模式下:
 1 <solr-home-directory>/
 2    solr.xml
 3    core_name1/
 4       core.properties
 5       conf/
 6          solrconfig.xml
 7          managed-schema
 8       data/
 9    core_name2/
10       core.properties
11       conf/
12          solrconfig.xml
13          managed-schema
14       data/

  雲模式下:數據庫

1 <solr-home-directory>/
2    solr.xml
3    core_name1/
4       core.properties
5       data/
6    core_name2/
7       core.properties
8       data/
其中,有些文件是很是重要的:
  • solr.xml 爲Solr服務器實例指定配置選項。具體如何配置,後面會專門講解。
  • 在每個Core裏面:
    • core.properties爲每個Core指定了諸如名稱,所屬集合,schema的位置等等屬性。
    • conf/solrconfig.xml控制高級行爲。好比,你能夠在該文件中指定數據目錄的替代位置。
    • conf/managed-schema存放文檔的描述。第三篇的建立Core小節提到過的數據驅動的Schema,就是在這裏獲得展示的,根據添加的不一樣的帶索引文件,managed-schema文件的內容會依據推導出的類型動態的調整。Schema定義一個字段集合的文檔。在這裏既定義字段類型,又定義字段自己。字段類型定義很是的強大甚至還包含了Solr是如何處理進入字段的值和查詢值得描述的。
    • data/該目錄包含基礎的索引文件。
相關文章
相關標籤/搜索