概念原理.md

时间:2022-11-14 13:34:42
【文件属性】:

文件名称:概念原理.md

文件大小:5KB

文件格式:MD

更新时间:2022-11-14 13:34:42

es

elasticsearch 简单介绍 在分布式系统中,单机无法存储规模巨大的数据,水平扩容增加机器来提高扩展能力,因此,需要把数据分成若干小块分配到各个机器上,然后通过某种策略找到某个数据块所在的位置 在分布式系统中,会把数据复制成多个副本,放置到不同的机器中,增加系统的可用性,同时数据副本还可以使度操作并发执行,分担集群压力。但多副本带来的问题是数据一致性 ES 将数据副本分成主从两份,主分片和副分片,恢复阶段以主分片为准 分片是底层的基本读写单元,分片的目的是分割巨大索引,让读写可以并行操作,分片是数据的容器,文档保存在分片内,不会跨分片存储。分片又被分配到集群内的各个节点里。当集群规模扩大或缩小时,ES 会自动在各节点中迁移分片,使数据仍然均匀分布在集群 一个 ES 索引包含很多分片,一个分片是一个 Lucene 的索引,它本生就是一个完整的搜索引擎,可以独立执行建立索引和搜索任务。Lucene 索引又由很多分段组成,每个分段都是一个倒排索引。ES 每次 “refresh” 都会生成一个新的分段,其中包含若干文档的数据。在每个分段内部,文档的不同字段被单独建立索引。每个字段的值由若干词(Term)组成,Term 是原文本内容经过分词器处理和语言处理后的最终结果(例如,去除标点符号和转换为词根)


网友评论