第4章 探究分布式索引架构

在前面的章节里,我们已经学习了如何使用不同的打分公式,也了解了使用这些打分公式的好处。我们也学习了何如使用不同的倒排表结构来改变索引数据的方式。此外,我们也学习了自如应用近实时搜索和数据实时获取(real-time GET),了解了检索器(searcher)重启(reopen)背后的意义。我们也探讨了多语言数据的处理,也学习了配置事务日志来实现业务需求。最后,我们学习段合并(segments merging)、合并策略和合并任务执行计划相关的知识。在本章,读者将了解如下的知识:
  • 如何为集群选择合适的分片(shard)和分片副本(replica)的数量
  • 路由是什么,路由对ElasticSearch起着什么样的作用
  • ShardAllocator是如何工作的,如何配置它
  • 如何根据业务需求来调整分片分发机制
  • 如何选择合适的分片来执行相关的命令
  • 如何结合现有的知识配置一个真实业务场景的群集
  • 数据和搜索并发量增长时如何应对