Elasticsearch7.X集成jieba分词插件

导读:本篇文章讲解 Elasticsearch7.X集成jieba分词插件,希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com

前言

  • jieba分词是中文里面比较好的分词器,而当前Elasticsearch官方没有直接集成jieba分词,需要我们通过配置plugins的方式使用jieba分词器作为es的analyzer。

一、环境介绍 :

  • centOS7
  • elasticsearch 7.9.0
  • elasticsearch-jieba-plugin-7.4.2 (简单的修改,即可适配不同版本的ES)

二、下载针对es的jieba分词插件,当前jieba分词插件对es的支持情况如图

jieba分词插件github地址
对应版本图

  • 本次下载的是7.4.2
    在这里插入图片描述

三、打包&安装&使用

1、修改文件

  • jieba分词插件没有7.9.0版本的,本次下载的是7.4.2
  • 为了适配不同版本ES需要修改 jieba 分词插件版本

根目录下的:build.gradle
主要修改 version和依赖ES的版本,例如为7.9.0的ES打包,这里都改成7.9.0
src/main/resources目录下的:plugin-descriptor.properties
主要修改 version 和 elasticsearch.version 分别表示插件的版本和支持ES的版本,同样,如果是支持7.9.0的插件,都改为7.9.0就可以。

2、自动化打包构建jieba分词插件,需要提前下载gradle工具

# 找到下载文件,解压
unzip elasticsearch-jieba-plugin-7.4.2.zip
# 进入文件夹
cd elasticsearch-jieba-plugin-7.4.2
# gradle进行编译
gradle pz

3、拷贝生成的包至Elashticsearch安装路径下的plugins路径

#创建存放 jieba 插件路径
mkdir -p plugins/elasticsearch-jieba-plugin
  • 打包好的插件在目录: ./build/distributions
cp build/distributions/elasticsearch-jieba-plugin-7.9.0.zip ${elasticsearch_home}/plugins/elasticsearch-jieba-plugin

4、解压缩文件并删除压缩包

unzip elasticsearch-jieba-plugin-7.9.0.zip
rm elasticsearch-jieba-plugin-7.9.0.zip

5、重新启动ES服务

nohup ./bin/elasticsearch >>elasticsearch.log &
  • 可以看到es启动日志,已加载jieba插件
    es启动日志

6、用kibana测试jieba分词

  • 繁体
GET /_analyze
{
  "analyzer": "jieba_search",
  "text": "中華人民共和國"
}

繁体分词

  • 中文
GET /_analyze
{
  "analyzer": "jieba_index",
  "text": "中华人民共和国"
}

中文分词

四、 CentOS7安装gradle

五、 Kibana 7.9.0插件的安装

六、 ElasticSearch7.9.0集群搭建详细步骤

总结

版本不兼容的处理方法
适配不通ES版本

如果此篇文章有帮助到您, 希望打大佬们能关注点赞收藏评论支持一波,非常感谢大家!
如果有不对的地方请指正!!!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/88172.html

(0)
小半的头像小半

相关推荐

极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!