solr相關文章

 

Solr集羣架構概述及delta-import詳細配置

背景 因爲項目緣由,從新熟悉了下Solr,版本爲3.6,搭建了主從Solr服務,並使用DIH從RDBMS數據源增量更新索引。 其實也沒什麼技術含量,就是簡單作個總結,分別從部署架構和增量更新兩個方面說明下。 Solr Replication solr的主從實際上是他的replication集羣,從本質上說是經過ReplicationHandler來實現的,除了solr server之間能夠互相同步以外,每一個solr實例內部的core之間也是能夠實現同步的,而能自身同步自身的實例稱爲Repeater,它的存在...
  閱讀(225)  評論(0)
 
 

學術分享搜索平臺——中期報告

1、      項目概況 學術分享搜索引擎主要基於爬取的學術數據,提供搜索,可視化,推薦三大塊功能,而且支持用戶分享感興趣的學術資源,結合「衆包」來打造一個更社交化的學術搜索平臺。相比於傳統的學術搜索,可視化和用戶的加入能讓平臺幫助用戶發現更多的東西。 個人工做是整個平臺的開發和搭建。從數據上說,涵蓋了數據爬取,數據處理,分佈式存儲,創建索引等工做;從功能上說,涵蓋了網站搭建,搜索服務,可視化...
  閱讀(599)  評論(0)
 
 

學術分享搜索平臺——設計方案

項目背景 有兩類和咱們大學生息息相關的產品。一類是微博,人人,豆瓣這些偏SNS的社交平臺,推薦同窗朋友的信息,幫助咱們找到可能認識的人,可能喜歡的書,可能愛看的電影等等。另外一類是學術相關的搜索引擎,好比Google Scholar,Microsoft Academic Search Engine,經過搜索關鍵字,提供一些匹配度最高的學術論文,提供不少便利。 然而,學術搜索引擎是一個比較通用...
  閱讀(1001)  評論(2)
 
 

Solr搜索服務架構圖

分享我本身的Solr搜索服務架構圖以及幾張Solr的架構圖。 在Google Doc上的兩頁ppt: 剛開始在gliffy上畫的同上的一張圖 Solr的總體架構圖: 更具體的solr request: Solr兼容lucene,多種方式創建索引的架構圖: 更多關於如何定製solr搜索服務的文章,見之...
  閱讀(1315)  評論(1)
 
 

solr進階: 如何定製搜索服務,擴展搜索邏輯

前兩天發了篇"剖析solr實用性",主要黑了solr建索引讓我以爲不舒服,還黑了solr只是個通用的丟入了servlet容器裏的簡單服務,事實證實我錯了。這篇博客我要糾正並回答那篇博客裏本身總結的問題:如何定製solr實現本身的搜索服務。 solr是一個可擴展的服務,咱們能夠添加本身的包和類,在solr已經實現的default處理邏輯之上,再添加咱們本身的搜索邏輯。實現手段就是繼承solr的基礎...
  閱讀(1364)  評論(6)
 
 

剖析solr實用性

個人使用經歷 使用solr3.6版本,配合本身用lucene3.6創建的索引,搭建了一個搜索服務,前臺經過http訪問solr服務,獲取由solr排序後的結果集。環境是linux ubuntu,servlet容器是tomcat。這個搜索服務是提供給php開發人員使用的。根據我如今對solr的理解和使用感覺,我想說說solr這玩意兒的實用性。 我對solr的理解 solr包裝了luce...
  閱讀(716)  評論(0)
 
 

Solr配置搜索服務

背景 我用Lucene3.6,爲php語言搭建的平臺提供一套搜索服務,可是lucene只是個提供索引操做的庫,須要一個web-service來提供給java外的語言,使之能夠經過http方式發送搜索請求並獲得如json, xml格式的查詢結果集數據。而Solr是一個二次包裝了Lucene庫的搜索服務容器,兼容lucene的api,能夠在jetty或者Tomcat這樣的容器裏以web服務的方式啓動...
 

Solr的配置及從數據庫創建索引

    Solr 是一個基於 Lucene 的 Java 搜索引擎服務器。 Solr 提供了層面搜索、命中醒目顯示而且支持多種輸出格式(包括 XML/XSLT 和 JSON 格式)。它易於安裝和配置,並且附帶了一個基於 HTTP 的管理界面。 Solr 已經在衆多大型的網站中使用,較爲成熟和穩定。 Solr 包裝並擴展了 Lucene ,因此 Solr 的基本上沿用了 Lucene 的相關術語。更重要的是, Solr 建立的索引與 Lucene 搜索引擎庫徹底兼容。經過對 Solr 進行適當的配置,某些狀況下可能須要進行編碼, Solr 能夠閱讀和使用構建到其餘 Lucene 應用程序中的索引。此外,不少 Lucene 工具(如 Nutch 、 Luke )也可使用 Solr 建立的索引。php

 

Apache SolrCloud介紹及安裝

在咱們應用還很眇小的時候,一臺Solr服務器能徹底勝任這份工做,隨着咱們應用慢慢長大,訪問也愈來愈多,一臺Solr服務器的弊病也逐漸顯現如查詢變慢了,機器宕機就沒法繼續提供服務,因而乎咱們引入了Solr集羣,經過前端負載均衡和索引Replication來分擔一臺機器的壓力,這樣既能提升查詢速度,也能避免單機故障問題並且是可伸縮的解決方案,一切看起來很OK,問題也暫時解決了,可是好景不長,隨着應用的發展,數據也在與日俱增,須要索引的數據也愈來愈多,索引文件變得愈來愈龐大,Replication索引變得愈來愈低效高成本,每一個Solr實例都保存全量大索引數據的方式顯然又成了系統性能和可伸縮性的瓶頸,若是能將大索引文件切分,分佈在集羣中不一樣機器中且查詢的準確性和可用性又不會受到影響該是件多麼美好的事情啊,因而SolrCloud出現了...
SolrCloud是基於ZooKeeper和Solr的分佈式解決方案,爲Solr添加分佈式功能,用於創建高可用,高伸縮,自動容錯,分佈式索引,分佈式查詢的Solr服務器集羣;SolrCloud並不是一個新的軟件發佈包,而是Solr4.0版本新增組件用於跟ZooKeeper配合提供分佈式功能,部署時只是修改啓動配置;
 
 

Apache Solr DataImportHandler Scheduler

I'm creating this project so that people don't have to build DIH Scheduler source themselves.html

The source was originally published in Solr Wiki and soon after, understandably, more and more people started asking for compiled version so they can just drop a JAR file in their deployed Solr's lib folder, customize their scheduler params and start using it.前端

So here it is (on the Downloads page). Enjoy it and please feel free to post any questions and suggestions here.java

 

Solr Documentation

Official documentation for the latest release of Solr can be found on the Solr website. Of particular note is the Solr Reference Guide which is published by the project after each minor release.linux

The rest of this wiki is community edited and captures version agnostic information, User submitted Tips & Tricks, historical information on Solr, as well as some areas of Solr not yet covered in the Reference Guide.web

 

 

Java 技術專區技術播客系列:第3 季Grant Ingersoll 談Mahout 與機器 ...

搜索結果描述:Grant Ingersoll 講解本次課程,Grant 是Lucid Imagination 首席科學家, ... 項目的 推崇者,我想咱們能夠開始咱們的會話了,Grant,請首先介紹一下什麼是. Mahout。 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-gloverpodcast3/glover-ingersoll-110811-zh.pdf算法

搜索結果標題:數據庫

使用Apache Lucene 和Solr 4 實現下一代搜索和分析

搜索結果描述:2013年12月5日 ... Grant Ingersoll 是Lucid Imagination 的創始人和技術成員之一。Grant 的編程興趣 包括信息檢索、機器學習、文本分類和提取。Grant 是Apache ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-solr-lucene/apache

搜索結果標題:編程

Grant Ingersoll 探討Solr 和Lucene - IBM

搜索結果描述:瀏覽IBM developerWorks 中國網站Java technology 專區全部文章的列表。您能夠 按做者或主題查看列表,也能夠按日期或技術級別排序列表。 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?sort_by=&show_abstract=true&show_all=&search_flag=&contentarea_by=Java+technology&search_by=apache+solr&topic_by=-1&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&ibm-search=%E6%90%9C%E7%B4%A2

搜索結果標題:

Apache Mahout 簡介

搜索結果描述:2009年10月12日 ... Grant Ingersoll 是Lucid Imagination 的創始人及技術人員之一。Grant 的編程興趣 包括信息檢索、機器學習、文本分類和提取。Grant 是Apache ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-mahout/

搜索結果標題:

Apache Mahout:適合全部人的可擴展機器學習框架

搜索結果描述:2011年12月15日 ... Apache Mahout 專家Grant Ingersoll 引領您快速瞭解最新版本Mahout 中的機器 學習庫,並經過示例說明如何部署和擴展Mahout 的某些最經常使用的 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-mahout-scaling/

搜索結果標題:

使用Apache Lucene 和Solr 進行位置感知搜索

搜索結果描述:2010年2月22日 ... Grant Ingersoll 是Lucid Imagination 的創始人和技術成員之一。Grant 的編程興趣 包括信息檢索、機器學習、文本分類和提取。Grant 是Apache ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-spatial/

搜索結果標題:

Java 技術播客系列: Andrew Glover 採訪多位技術專家的訪談記錄

搜索結果描述:2013年12月9日 ... 當即收聽 (中文對話腳本): Apache Mahout 和創始人Grant Ingersoll 介紹了機器 學習和所涉及的概念,並解釋瞭如何將其應用到現實環境應用程序中 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-gloverpodcast3/

搜索結果標題:

使用Apache Solr 實現更加靈巧的搜索,第1 部分: 基本特性和Solr 模式

搜索結果描述:2007年7月2日 ... 在這篇分兩部分的文章中,Lucene Java™ 的提交人Grant Ingersoll 將介紹Solr 並 向您展現如何輕鬆地將其表現優異的全文本搜索功能加入到Web ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-solr1/

搜索結果標題:

使用Apache Solr 實現更加靈巧的搜索,第2 部分: 用於企業的Solr

搜索結果描述:2007年7月2日 ... 在本部分中,Lucene Java 的提交人Grant Ingersoll 經過對用於企業的特性(包括 管理界面、高級配置選項)以及與性能相關的特性(好比緩存、複製和 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-solr2/

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Lucene 和Solr 提交者Grant Ingersoll 介紹了與相關性、分佈式搜索和分面(facet) 相關的最新Lucene 和Solr 功能。本文將學習如何利用這些功能構建快速、高效、可 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/articles.jsp?view_by=search&search_by=lucene

搜索結果標題:

IBM developerWorks : Open source : 文檔庫

搜索結果描述:Lucene 和Solr 提交者Grant Ingersoll 介紹了與相關性、分佈式搜索和分面(facet) 相關的最新Lucene 和Solr 功能。本文將學習如何利用這些功能構建快速、高效、可 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?search_by=Lucene

搜索結果標題:

IBM developerWorks : Open source : 文檔庫

搜索結果描述:在這篇分兩部分的文章中,Lucene Java 的提交人Grant Ingersoll 將介紹Solr 並向 您展現如何輕鬆地將其表現優異的全文本搜索功能加入到Web 應用程序中。 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/opensource/articles.jsp?search_by=Apache

搜索結果標題:

數據科學與開源

搜索結果描述:2013年8月9日 ... 「Apache Mahout:適合全部人的可擴展機器學習框架」(Grant Ingersoll, developerWorks,2011 年11 月):Mahout 提交者Ingersoll 介紹了Mahout ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/opensource/os-datascience/index.html?ca=drs-

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Apache Mahout 項目旨在幫助開發人員更加方便快捷地建立智能應用程序。Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念,並演示瞭如何使用Mahout ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=Title&sort_order=1&start=1&end=34&topic_by=SPRING&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索結果標題:

IBM developerWorks 中國: Information management : 文檔庫

搜索結果描述:在這篇分兩部分的文章中,Lucene Java 的提交人Grant Ingersoll 將介紹Solr 並向 您展現如何輕鬆地將其表現優異的全文本搜索功能加入到Web 應用程序中。 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?search_by=%E6%90%9C%E7%B4%A2

搜索結果標題:

基於Apache Mahout 構建社會化推薦引擎

搜索結果描述:2010年1月21日 ... 「Apache Mahout 簡介」 (Grant Ingersoll,developerWorks,2009 年10 月):Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念,並演示了 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-lo-mahout/?cmp=dw&cpb=dw&ct=dwcom&cr=dwcom&ccy=cn

搜索結果標題:

IBM developerWorks 中國: 文檔庫

搜索結果描述:Lucene 和Solr 提交者Grant Ingersoll 介紹了與相關性、分佈式搜索和分面(facet) 相關的最新Lucene 和Solr 功能。本文將學習如何利用這些功能構建快速、高效、可 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/library/

搜索結果標題:

Apache Solr 的新特性

搜索結果描述:2008年11月25日 ... 在本文中,Solr 和Lucene 的負責人Grant Ingersoll 詳細介紹了Solr 1.3 的新改進, 包括分佈式搜索、輕鬆數據庫導入、集成拼寫檢查和新的擴展API ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/java/j-solr-update/?...2012-06-09

搜索結果標題:

IBM developerWorks 中國: Security : 文檔庫

搜索結果描述:Lucene 和Solr 提交者Grant Ingersoll 介紹了與相關性、分佈式搜索和分面(facet) 相關的最新Lucene 和Solr 功能。本文將學習如何利用這些功能構建快速、高效、可 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/security/tutorials.jsp?cv_doc_id=85035

搜索結果標題:

IBM developerWorks : Open source : 文檔庫

搜索結果描述:Apache Mahout 項目旨在幫助開發人員更加方便快捷地建立智能應用程序。Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念,並演示瞭如何使用Mahout ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?end_no=221&lcl_sort_order=asc&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&sort_order=asc&start_no=1&show_all

 

探索推薦引擎內部的祕密,第3 部分: 深刻推薦引擎相關算法- 聚類

搜索結果描述:2011年3月24日 ... 「Apache Mahout簡介」 (Grant Ingersoll,developerWorks,2009 年10 月):Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念,並演示了 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/

搜索結果標題:

IBM developerWorks : Open source : 文檔庫

搜索結果描述:Lucene 和Solr 專家Grant Ingersoll 將逐步向您介紹空間搜索的基礎知識,並演示 如何利用這些功能來加強您的下一個位置感知應用程序。 2010年02月22日. 
搜索結果 URL:https://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?site_id=10&contentarea_by=Open%20source&sort_by=Date&sort_order=2&start=1&end=250&topic_by=&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=Apache&industry_by=

搜索結果標題:

IBM developerWorks 中國: WebSphere : 文檔庫

搜索結果描述:Lucene 和Solr 提交者Grant Ingersoll 介紹了與相關性、分佈式搜索和分面(facet) 相關的最新Lucene 和Solr 功能。本文將學習如何利用這些功能構建快速、高效、可 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/websphere/libraryview.jsp?sort_by=&show_abstract=true&show_all=&search_flag=&contentarea_by=WebSphere'search_by=BPM+%E8%BF%81%E7%A7%BB&product_by=-1&topic_by=-1&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0

搜索結果標題:

IBM developerWorks 中國: Information management : 文檔庫

搜索結果描述:在本文中,Solr 和Lucene 的負責人Grant Ingersoll 詳細介紹了Solr 1.3 的新改進, 包括分佈式搜索、輕鬆數據庫導入、集成拼寫檢查和新的擴展API 等等。 技術文章 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?site_id=10&contentarea_by=Information%20%20management&sort_by=&sort_order=2&start=101&end=200&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=%E6%90%9C%E7%B4%A2&industry_by=&series_title_by=

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:在本文中,Solr 和Lucene 的負責人Grant Ingersoll 詳細介紹了Solr 1.3 的新改進, 包括分佈式搜索、輕鬆數據庫導入、集成拼寫檢查和新的擴展API 等等。 技術文章 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=Date&sort_order=2&start=1&end=47&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=XML&industry_by=&series_title_by=

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Apache Mahout 專家Grant Ingersoll 引領您快速瞭解最新版本Mahout 中的機器 學習庫,並經過示例說明如何部署和擴展Mahout 的某些最經常使用的算法。 技術文章 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?lcl_sort_order=asc&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&sort_order=desc&start_no=1&sort_by=Title&search_by=&topic_by=%E4%BD%93%E7%B3%BB%E6%9E%B6%E6%9E%84&search_flag=

搜索結果標題:

探索推薦引擎內部的祕密,第2 部分: 深刻推薦引擎相關算法- 協同過濾

搜索結果描述:2011年3月21日 ... Apache Mahout簡介:Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念 ,並演示瞭如何使用Mahout 來實現文檔集羣、提出建議和組織 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/?cmp=dw&cpb=dw&ct=dwcom&cr=dwcom&ccy=cn

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Mahout 的創始者Grant Ingersoll 介紹了機器學習的基本概念,並演示瞭如何使用 Mahout 來實現文檔集羣、提出建議和組織內容。 2009年10月12日. 使用Java Debug ... 
搜索結果 URL:https://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=&sort_order=2&start=501&end=600&topic_by=&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Lucene 和Solr 專家Grant Ingersoll 將逐步向您介紹空間搜索的基礎知識,並演示 如何利用這些功能來加強您的下一個位置感知應用程序。 技術文章, 2010年02月22  ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=&sort_order=2&start=401&end=500&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索結果標題:

IBM developerWorks 中國: Java technology : 文檔庫

搜索結果描述:Apache Mahout 專家Grant Ingersoll 引領您快速瞭解最新版本Mahout 中的機器 學習庫,並經過示例說明如何部署和擴展Mahout 的某些最經常使用的算法。 2011年12 ... 
搜索結果 URL:https://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?sort_by=Date&show_abstract=true&show_all=false&search_flag=&topic_by=%E7%BC%96%E7%A0%81&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&search_by=

搜索結果標題:

IBM developerWorks 中國: Information management : 文檔庫

搜索結果描述:Apache Mahout 專家Grant Ingersoll 引領您快速瞭解最新版本Mahout 中的機器 學習庫,並經過示例說明如何部署和擴展Mahout 的某些最經常使用的算法。 2011年12 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?end_no=100&lcl_sort_order=asc&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&sort_order=asc&start_no=1&sort_by=Title&search_by=&topic_by=%E4%BD%93%E7%B3%BB%E6%9E%B6%E6%9E%84&search_flag=

搜索結果標題:

使用PHP 和Apache Solr 實現企業搜索

搜索結果描述:2008年2月14日 ... 在Solr 專家Grant Ingersoll 所撰寫的「使用Apache Solr 實現更加靈巧的搜索,第1 部分:基本特性和Solr 模式」 和「第2 部分: 用於企業的Solr」 閱讀 ... 
搜索結果 URL:http://www.ibm.com/developerworks/cn/opensource/os-php-apachesolr/

相關文章
相關標籤/搜索