在 Elasticsearch 中,分片(shard)是将索引划分为多个较小的部分的过程。分片可以提高搜索性能和容错能力。下面是如何为书籍示例创建一个带有分片和中文分词器的索引。
我们将为 “books” 索引创建 3 个主分片(primary shards)和 1 个副本分片(replica shard)。
- 创建带有分片和映射的索引:
使用以下命令创建一个带有分片和映射的 “books” 索引:
curl -X PUT "localhost:9200/books?pretty" -H 'Content-Type: application/json' -d'
{
"settings": {
"index": {
"number_of_shards": 3,
"number_of_replicas": 1
},
"analysis": {
"analyzer": {
"ik_analyzer": {
"type": "custom",
"tokenizer": "ik_max_word"
}
}
}
},
"mappings": {
"properties": {
"title": {
"type": "text",
"analyzer": "ik_analyzer"
},
"author": {
"type": "keyword"
},
"publish_date": {
"type": "date"
},
"description": {
"type": "text",
"analyzer": "ik_analyzer"
}
}
}
}'
在这个示例中,我们创建了一个名为 “books” 的索引,并指定了 3 个主分片和 1 个副本分片。同时,我们定义了一个使用 ik_max_word
中文分词器的映射。
- 向带有分片和映射的索引中添加文档:
接下来,我们可以将书籍文档添加到 “books” 索引中。例如:
curl -X POST "localhost:9200/books/_doc?pretty" -H 'Content-Type: application/json' -d'
{
"title": "活着",
"author": "余华",
"publish_date": "1992-01-01",
"description": "《活着》讲述了农村人福贵悲惨的一生,通过福贵的人生遭遇,展示了一个在命运压迫下挣扎求生的弱者形象。"
}'
- 使用分片和映射进行搜索:
现在我们可以使用 Elasticsearch 的搜索功能来查询包含特定关键词的书籍。例如,我们可以搜索书籍简介中包含 “命运” 的书籍:
curl -X GET "localhost:9200/books/_search?pretty" -H 'Content-Type: application/json' -d'
{
"query": {
"match": {
"description": "命运"
}
}
}'
这将返回一个包含搜索结果的 JSON 对象。如果一切正常,您将在结果中看到 “活着” 这本书。
这个示例展示了如何在 Elasticsearch 中为书籍索引创建分片和使用中文分词器。使用分片可以提高搜索性能和容错能力。通过合理设置主分片和副本分片的数量,您可以根据实际需求和硬件资源调整索引的性能和可用性。
当您向索引中添加更多书籍文档时,Elasticsearch 会根据分片配置将这些文档均匀地分布在各个分片中。这样,在执行搜索请求时,Elasticsearch 可以并行地在各个分片上执行查询,从而加快搜索速度。同时,副本分片可以提高系统的容错能力,因为在某个分片出现故障时,副本分片可以顶替主分片继续提供服务。
在这个书籍示例中,我们使用了分片和中文分词器来创建索引、添加文档以及执行搜索。这些功能使得 Elasticsearch 成为一个强大的搜索和分析引擎,适用于处理大量的结构化和非结构化数据。
单节点的 Elasticsearch 集群支持分片。实际上,分片是 Elasticsearch 的一个内置功能,用于在各个节点上分配和管理数据。即使在单节点集群中,您也可以创建多个分片以便在需要时扩展集群。
在单节点集群中,您可以创建多个主分片,这些分片将存储在该节点上。不过,对于副本分片,您需要注意单节点集群的限制。在单节点集群中,您可以将副本分片的数量设置为 1 或更高,但实际上这些副本分片不会被分配,因为 Elasticsearch 不会在同一个节点上分配主分片和副本分片。
当您将单节点集群扩展为多节点集群时,Elasticsearch 会自动将副本分片分配到其他可用节点,从而提高数据的可用性和容错能力。
总之,单节点的 Elasticsearch 集群支持分片,您可以创建多个主分片来准备将来的扩展。然而,请注意在单节点集群中副本分片的限制。在扩展为多节点集群时,Elasticsearch 将自动处理副本分片的分配。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/181644.html