ElasticSearch的功能和特点是什么
更新:HHH   时间:2023-1-7


本篇文章为大家展示了ElasticSearch的功能和特点是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

1.自动维护数据的分布到多个节点的索引的简历,还有搜索请求分布到多个节点的执行

2.自动维护数据的冗余副本,保证说,一些机器宕机了,不会丢失任何的数据

3.封装了更多的高级功能,以提供更多高级的支持,快速开发应用

Elaticsearch的功能

1.分布式的搜索引擎和数据分析引擎 搜索:百度,网站的站内搜索、OA 数据分析:电商网站,最近7天牙膏销量排名前几的商家 分布式

2.全文检索,结构化检索,数据分析 全文检索:搜索商品名称包含牙膏的商品 select * from products where product_name like "%牙膏%" 结构化检索:搜索商品分类为日化商品都有哪些 select * from peoducts where category_id='日化用品' 部分搜索、自动完成、搜索纠错、搜索推荐 数据分析:分析每一个商品分类下有多少个商品 select categoey_id,count(*) from products group by category_id

3.对海量数据进行实时的处理 分布式:es自动可以将海量数据分散到多台服务器上去存储和检索 海量数据的处理:分布式以后,就可以采用大量的服务器去存储和检索数据,自然而然就可以实现海量数据的处理 近实时:检索数据需要花费1小时(这就不叫近实时,离线批处理,batch-peocessing);在秒级别对数据进行搜索和分析 跟分布式/海量数据相反的:lucence单机应用,只能在单台服务上使用,最多只能处理单台服务器可以处理的数据量

使用场景

1.github

2.Stack Overflow

3.电商搜索商品

4.日志数据分析 ELK技术 elasticsearch+logstash+kibana 复杂数据分析

5.商品价格监控网站

6.BI 商业智能,Business Intelligence 数据挖掘 分析某某区域最近三年的用户消费金额的趋势,产生数据报表,es进行数据分析和挖掘,kibanna进行数据可视化

国内: 站内搜索: 电商,招聘,门户

it系统搜索,OA,crm,Erp 数据分析:当前热门的一个使用场景

特点

1.可以作为大型分布式集群技术,处理PB级数据,服务大公司;也可以运用在单机上,服务小公司

2.es不是什么新技术 主要是将全文检索、数据分析以及分布式技术,合并在一起,形成es lucene全文检索,分布式数据库mycat

核心概念

1.Near Realtime (NRT):近实时,从写入数据到数据可以被搜索到有一个小延迟 大概1秒 2.Cluster:集群,包含多个节点 3.Node:节点 4.Dcoument&field:文档,通常用json数据结构表示,每个index下的type中,都可以存储多个document。一个document里面有多个field,每个field就是一个数据字段 5.index:索引,包含一堆有相似结构的文档数据,比如可以有一个客户索引,商品分类索引,订单索引 商品index:里面存放了所有的商品数据,商品document 6.Type类型,每个索引里有一个或多个type type,商品种类分很多种类,

7.shard:单台机器无法存储大量数据,es可以将一个索引中的数据切分为多个shard,分布在堕胎服务器上,有了shard就可以横向扩展 存储更多数据,让搜索和分析等操作到多台服务器上去执行,提升吞吐量和性能。每个shard都是一个lucene index 8.replica:服务器会出现故障或宕机,因此shard可能会丢失,每个shard创建多个replica,可以在shard故障时提供备用服务,多个splica可以提升搜索操作的吞吐量。 primary shard(建立索引时一次设置,不能修改,默认5个),replica shard(随时修改数量,默认1个),默认每个索引10个shard,5个primaryshard,5个replia shard,最小高可用配置,是两台服务器

shard和replia 是部分存储在节点上

elasticSearch核心概念 vs 数据库核心概念

Elasticsearch 数据库 document 行 Type 表 index 数据库

如何快速了解集群的健康状况?green、yellow、red

green:每个索引的primary shard和replica shard都是active状态 yellow:每个索引的primary shard都是active状态,但是部分replica shard不是active状态,处于不可用状态 red:不是所有索引的peimary shard都是active状态,部分索引有数据丢失了

处于yellow情况下的原因 因为是一个笔记本,就启动了一个es进程,相当于只有一个node。现在es中有一个index,就是kibanna自己内置建立的index 由于默认是给每个index分配5个primary shard和relica shard,而primary shard和replica shard不能再同一台机器上(为了容错) 所以只有一个primary shard被分配和启动了,但一个replica shard没有第二台机器启动

上述内容就是ElasticSearch的功能和特点是什么,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注天达云行业资讯频道。

返回大数据教程...