Spring Boot + Elasticsearch 實現索引的平常維護

全文檢索的應用愈來愈普遍,幾乎成了互聯網應用的標配,商品搜索、日誌分析、歷史數據歸檔等等,各類場景都會涉及到大批量的數據,在全文檢索方面,方案無外乎Lucene、Solr、Elasticsearch三種應用的較爲普遍。es、solr的底層都依託於Lucene,但es比solr學習成本更低,因爲其提供的RESTful API簡單快捷,對互聯網應用開發而言更是如虎添翼。java

下面結合以實際案例,經過Java API的形式操做es數據集。程序員

框架選型基礎是Spring Boot + Spring-data-elasticsearch + elasticsearch。web

使用ElasticsearchRepository的形式來鏈接、維護ES數據集,ElasticsearchRepository中提供了簡單的操做索引數據的方法集合,繼承自ElasticsearchCrudRepository,涵蓋了CRUD、排序、分頁等常見的基本操做功能。spring

 
  1. @NoRepositoryBean  apache

  2. public interface ElasticsearchRepository<T, ID extends Serializable> extends ElasticsearchCrudRepository<T, ID> {  tomcat

  3.    <S extends T> S index(S var1);  架構

  4.  

  5.    Iterable<T> search(QueryBuilder var1);  app

  6.  

  7.    Page<T> search(QueryBuilder var1, Pageable var2);  框架

  8.  

  9.    Page<T> search(SearchQuery var1);  dom

  10.  

  11.    Page<T> searchSimilar(T var1, String[] var2, Pageable var3);  

  12.  

  13.    void refresh();  

  14.  

  15.    Class<T> getEntityClass();  

  16. }  

從基本的pom配置開始

 
  1. <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

  2.    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

  3.    <modelVersion>4.0.0</modelVersion>

  4.    <groupId>com.esp.index.data</groupId>

  5.    <artifactId>esp-cube</artifactId>

  6.    <version>0.0.1-SNAPSHOT</version>

  7.  

  8.    <parent>

  9.        <groupId>org.springframework.boot</groupId>

  10.        <artifactId>spring-boot-starter-parent</artifactId>

  11.        <version>1.5.2.RELEASE</version>

  12.        <relativePath /> <!-- lookup parent from repository -->

  13.    </parent>

  14.  

  15.    <properties>

  16.        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>

  17.        <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>

  18.        <java.version>1.7</java.version>

  19.    </properties>

  20.  

  21.    <dependencies>

  22.        <dependency>

  23.            <groupId>org.springframework.boot</groupId>

  24.            <artifactId>spring-boot-starter-jdbc</artifactId>

  25.            <exclusions>

  26.                <exclusion>

  27.                    <groupId>org.apache.tomcat</groupId>

  28.                    <artifactId>tomcat-jdbc</artifactId>

  29.                </exclusion>

  30.            </exclusions>

  31.        </dependency>

  32.        <dependency>

  33.            <groupId>org.springframework.boot</groupId>

  34.            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>

  35.        </dependency>

  36.        <dependency>

  37.            <groupId>org.springframework.boot</groupId>

  38.            <artifactId>spring-boot-starter-web</artifactId>

  39.            <exclusions>

  40.                <exclusion>

  41.                    <artifactId>log4j-over-slf4j</artifactId>

  42.                    <groupId>org.slf4j</groupId>

  43.                </exclusion>

  44.            </exclusions>

  45.        </dependency>

  46.        <dependency>

  47.            <groupId>org.springframework.boot</groupId>

  48.            <artifactId>spring-boot-starter</artifactId>

  49.            <exclusions>

  50.                <exclusion>

  51.                    <groupId>org.springframework.boot</groupId>

  52.                    <artifactId>spring-boot-starter-logging</artifactId>

  53.                </exclusion>

  54.            </exclusions>

  55.        </dependency>

  56.        <dependency>

  57.            <groupId>org.springframework.boot</groupId>

  58.            <artifactId>spring-boot-starter-test</artifactId>

  59.            <scope>test</scope>

  60.        </dependency>

  61.        <dependency>

  62.            <groupId>org.springframework.boot</groupId>

  63.            <artifactId>spring-boot-starter-log4j</artifactId>

  64.            <version>1.3.1.RELEASE</version>

  65.        </dependency>

  66.    </dependencies>

  67.  

  68.    <build>

  69.        <finalName>esp-cube</finalName>

  70.        <plugins>

  71.            <plugin>

  72.                <groupId>org.springframework.boot</groupId>

  73.                <artifactId>spring-boot-maven-plugin</artifactId>

  74.            </plugin>

  75.        </plugins>

  76.    </build>

  77. </project>

編寫本身的Resository操做類

 
  1. public interface ArticleSearchRepository extends ElasticsearchRepository<Article, Long>{

  2.    List<Article> findByAbstractsAndContent(String abstracts, String content);

  3. }

其中Article爲是與elasticsearch鏈接的實體類,相似於PO的概念,其中指定的索引名稱、類型名稱、及分片、副本數量等要素。

 
  1. @Data

  2. @Document(indexName = "article_index", type = "article", shards = 5, replicas = 1, indexStoreType = "fs", refreshInterval = "-1")

  3. public class Article implements Serializable {

  4.  

  5.    /**

  6.     * serialVersionUID:

  7.     *

  8.     * @since JDK 1.6

  9.     */

  10.    private static final long serialVersionUID = 1L;

  11.  

  12.    @Id

  13.    private Long id;

  14.    /** 標題 */

  15.    private String title;

  16.    /** 摘要 */

  17.    private String abstracts;

  18.    /** 內容 */

  19.    private String content;

  20.    /** 發表時間 */

  21.    @Field(format = DateFormat.date_time, index = FieldIndex.no, store = true, type = FieldType.Object)

  22.    private Date postTime;

  23.    /** 點擊率 */

  24.    private Long clickCount;

  25. }

咱們須要定義域的實體和一個Spring data的基本的CRUD支持庫類。用id註釋定義標識符字段,若是你沒有指定ID字段,Elasticsearch不能索引你的文件。同時須要指定索引名稱類型,@Document註解也有助於咱們設置分片和副本數量。

接口類

 
  1. public interface ArticleService {

  2.  

  3.    /**

  4.     * saveArticle: 寫入<br/>

  5.     *

  6.     * @author guooo Date:2017年9月27日下午3:20:06

  7.     * @param article

  8.     * @return

  9.     * @since JDK 1.6

  10.     */

  11.    long saveArticle(Article article);

  12.  

  13.    /**

  14.     * deleteArticle: 刪除,並未真正刪除,只是查詢不到<br/>

  15.     *

  16.     * @author guooo Date:2017年9月27日下午3:20:08

  17.     * @param id

  18.     * @since JDK 1.6

  19.     */

  20.    void deleteArticle(long id);

  21.  

  22.    /**

  23.     * findArticle: <br/>

  24.     *

  25.     * @author guooo Date:2017年9月27日下午3:20:10

  26.     * @param id

  27.     * @return

  28.     * @since JDK 1.6

  29.     */

  30.    Article findArticle(long id);

  31.  

  32.    /**

  33.     * findArticlePageable: <br/>

  34.     *

  35.     * @author guooo Date:2017年9月27日下午3:20:13

  36.     * @return

  37.     * @since JDK 1.6

  38.     */

  39.    List<Article> findArticlePageable();

  40.  

  41.    /**

  42.     * findArticleAll: <br/>

  43.     *

  44.     * @author guooo Date:2017年9月27日下午3:20:15

  45.     * @return

  46.     * @since JDK 1.6

  47.     */

  48.    List<Article> findArticleAll();

  49.  

  50.    /**

  51.     * findArticleSort: <br/>

  52.     *

  53.     * @author guooo Date:2017年9月27日下午3:20:18

  54.     * @return

  55.     * @since JDK 1.6

  56.     */

  57.    List<Article> findArticleSort();

  58.  

  59.    /**

  60.     * search: <br/>

  61.     *

  62.     * @author guooo Date:2017年9月27日下午3:20:22

  63.     * @param content

  64.     * @return

  65.     * @since JDK 1.6

  66.     */

  67.    List<Article> search(String content);

  68.  

  69.    /**

  70.     * update: es沒有修改操做,結合save操做完成<br/>

  71.     *

  72.     * @author guooo Date:2017年9月27日下午3:20:25

  73.     * @param id

  74.     * @return

  75.     * @since JDK 1.6

  76.     */

  77.    long update(long id);

  78. }

接口實現

 
  1. @Service

  2. public class ArticleServiceImpl implements ArticleService {

  3.  

  4.    final int page = 0;

  5.    final int size = 10;

  6.  

  7.    /* 搜索模式 */

  8.    String SCORE_MODE_SUM = "sum"; // 權重分求和模式

  9.    Float MIN_SCORE = 10.0F; // 因爲無相關性的分值默認爲 1 ,設置權重分最小值爲 10

  10.  

  11.    Pageable pageable = new PageRequest(page, size);

  12.  

  13.    @Autowired

  14.    ArticleSearchRepository repository;

  15.  

  16.    @Override

  17.    public long saveArticle(Article article) {

  18.        Article result = repository.save(article);

  19.        return result.getId();

  20.    }

  21.  

  22.    @Override

  23.    public void deleteArticle(long id) {

  24.        repository.delete(id);

  25.    }

  26.  

  27.    @Override

  28.    public Article findArticle(long id) {

  29.        return repository.findOne(id);

  30.    }

  31.  

  32.    @Override

  33.    public List<Article> findArticlePageable() {

  34.  

  35.        return repository.findAll(pageable).getContent();

  36.    }

  37.  

  38.    @Override

  39.    public List<Article> findArticleAll() {

  40.        Iterable<Article> iterables = repository.findAll();

  41.        List<Article> articles = new ArrayList<>();

  42.        for (Article article : iterables) {

  43.            articles.add(article);

  44.        }

  45.        return articles;

  46.    }

  47.  

  48.    @Override

  49.    public List<Article> findArticleSort() {

  50.        List<Order> orders = new ArrayList<>();

  51.        Order order = new Order(Direction.ASC, "clickCount");

  52.        orders.add(order);

  53.        Sort sort = new Sort(orders);

  54.        Iterable<Article> iterables = repository.findAll(sort);

  55.        List<Article> articles = new ArrayList<>();

  56.        for (Article article : iterables) {

  57.            articles.add(article);

  58.        }

  59.        return articles;

  60.    }

  61.  

  62.    @Override

  63.    public List<Article> search(String content) {

  64.        return repository.findByAbstractsAndContent(content, content);

  65.    }

  66.  

  67.    @Override

  68.    public long update(long id) {

  69.        Article article = repository.findOne(id);

  70.        article.setTitle("test");

  71.        Article retun = repository.save(article);

  72.        System.out.println(retun.getId()+"更新的數據");

  73.        return retun.getId();

  74.    }

  75. }

是否是與JPA、hibernate操做數據集的手法很相似?

controller方法類:

 
  1. @RestController

  2. @RequestMapping(value = "/article")

  3. public class APIArticleController {

  4.  

  5.    @Autowired

  6.    ArticleService articleService;

  7.  

  8.  

  9.    @RequestMapping(value = "save", method = RequestMethod.POST)

  10.    public long save() {

  11.        for (int i = 10000; i < 12000; i++) {

  12.            Article article = new Article();

  13.            article.setClickCount(Long.valueOf(i + RandomUtils.nextInt(23, i)));

  14.            article.setAbstracts("個人一個測試" + i);

  15.            article.setContent(i + "這是第一個測試的內容@spring-data-elasticsearch");

  16.            article.setPostTime(new Date());

  17.            article.setId(Long.valueOf(RandomUtils.nextLong(i, i)));

  18.            long _id = articleService.saveArticle(article);

  19.            System.out.println(_id);

  20.        }

  21.        return 23;

  22.    }

  23.  

  24.    @RequestMapping(value = "delete", method = RequestMethod.POST)

  25.    public void deleteArticle(long id) {

  26.        articleService.deleteArticle(id);

  27.    }

  28.  

  29.    @RequestMapping(value = "findOne", method = RequestMethod.POST)

  30.    public Article findArticle(long id) {

  31.        return articleService.findArticle(id);

  32.    }

  33.  

  34.    @RequestMapping(value = "findArticlePageable", method = RequestMethod.POST)

  35.    public List<Article> findArticlePageable() {

  36.        return articleService.findArticlePageable();

  37.    }

  38.  

  39.    @RequestMapping(value = "findArticleAll", method = RequestMethod.POST)

  40.    public List<Article> findArticleAll() {

  41.        return articleService.findArticleAll();

  42.    }

  43.  

  44.    @RequestMapping(value = "findArticleSort", method = RequestMethod.POST)

  45.    public List<Article> findArticleSort() {

  46.        return articleService.findArticleSort();

  47.    }

  48.  

  49.    @RequestMapping(value = "search", method = RequestMethod.POST)

  50.    public List<Article> search(String content) {

  51.        return articleService.search(content);

  52.    }

  53.  

  54.    @RequestMapping(value = "update", method = RequestMethod.POST)

  55.    public long update(long id) {

  56.        return articleService.update(id);

  57.    }

  58. }

Spring Boot的啓動類及配置項,這裏略過,項目啓動後,可能過controller暴露出來的方法進行Article數據索引的CRUD操做。

擴展閱讀:

歪脖貳點零 ∣迭代當下 · 架構將來

程序員,除了編碼,生活還應該有沉澱!

長按,識別二維碼,加關注

相關文章
相關標籤/搜索