你不知道的哪些关于数据存储的知识

来源: 云巴巴 2022-11-22 11:05:58

 

    本篇文章主要谈一下MySQLHBaseES这几种数据存储的主要知识。

    MySQL,关系型数据库。主要面向OLTP,支持事务,支持二级索引。支持sql,支持主从、Group Replication架构模型。

    HBase是基于HDFS,支持海量数据读写,尤其是写。支持上亿行、上百万列的,面向列的分布式NoSql数据库,天然分布式,主从架构,不支持事务,不支持二级索引,不支持sql

    ES是一款分布式的全文检索框架,虽然ES也提供存储,检索功能,但我一直不认为ES是一款数据库,底层基于Lucene实现。但是随着ES功能越来越强大,与数据库的界限也越来越模糊,天然分布式,p2p架构,不支持事务,采用倒排索引提供全文检索。

    MySQL采用行存储,HBase是面向列的NoSql数据库,解释了行、列存储的区别。至于ES,我也说不清楚它是什么存储方式,暂且叫它索引存储吧。

    MySQL中要提前定义表结构,数据以行为单位组织在一起的,假如某一行的某一列没有数据,也需要占用存储空间;也就是说表共有多少列(属性)需要提前定义好,并且同时需要定义好每个列所占用的存储空间。

    HBase则是以列为单位存储数据,每一列就是一个key-valueHBase的表列(属性)不用提前定义。列可以动态扩展,比如人员信息表中需要添加一个新的“address”字段,MySQL需要提前alter表,HBase的话直接插入即可。

    ES比较灵活,索引中的field类型可以提前定义。也可以不定义,如果不定义,会有一个默认类型,不过出于可控性考虑,关键字段最好提前定义好。

    MySQL依然会为该字段保留空间,因为后续有可能会有update语句来更新该记录,补上sex内容;简单的展示了数据在MySQLHBase中存储差异,和真实的情况还有差距,可以看到即使第二条记录的sex字段为空,而HBase则是把每一列都看做是一条记录,row+列名作为keydata作为value,依次存放。假如某一行的某一个列没有数据,则直接跳过该列。对于稀疏矩阵的大表,HBase能节省空间。

    说完MySQLHBase,这里要重点说一下ESES的存储方式和上面两个都不一样,MySQLHBase是将数据按不同的方式进行存储。好歹它们存的还是数据,而ES则存的是倒排索引。

版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

海量数据存储的表结构优化是什么样的

海量数据存储的表结构优化是什么样的

现在,无论是工作还是学习,都要使用网络,海量数据存储系统是网络系统的升级版,海量数据存储可以有效解决目前面临四大安全威胁。要建立一个完善的海量数据存储防护管理体系,必须从客户端软件、邮件服务器端安全、安全邮件信息服务提供商等各个企业方面可以采取一些相应的技

2022-11-21 10:34:48

数据存储的逻辑卷和文件系统是什么

数据存储的逻辑卷和文件系统是什么

提起数据存储的话,如果你还不知道逻辑卷和文件系统是什么,那可是万万不行的。 为了方便管理,我们也可以将多个物理块设备,组合成一个容量更大的逻辑块设备,也可以将硬盘这样的物理块设备,分割成多个逻辑块设备。 底层的相关技术和工具,包括RAID(大家可能比较

2022-11-22 11:07:01

阿里云云服务器中快速存储数据信息的秘密是?

阿里云云服务器中快速存储数据信息的秘密是?

云服务器在使用的同时经常会遇到的安全方面的问题有哪些?比如说云服务器中的信息遭到窃取或者是遭到外来攻击之后云服务器中的数据信息造成了泄露,这些都是我们使用云服务器时经常会遇到的安全方面的问题。

2022-11-24 10:18:15

新一代的数据存储技术到底有多强大?

新一代的数据存储技术到底有多强大?

云存储是目前发展最为迅猛,远远超过了其他大数据应用的发展速度,必将是未来数据应用的重要组成部分。另外,数据分层、数据存储、融合以及智能也将逐渐普及应用,可以说,安防行业为满足大数据的到来,已经做足了准备。

2022-11-22 16:06:07

数据存储的DAS、NAS和SAN三种存储方式比较

数据存储的DAS、NAS和SAN三种存储方式比较

存储应用最大的特点是没有标准的体系结构,DAS、NAS和SAN这三种存储方式共存,互相补充,已经很好满足目前企业信息化应用。 DAS采用了存储设备直接连接应用服务器,从连接方式上对比,具有一定的灵活性和限制性。NAS通过网络(TCP/IP,ATM,FDD

2022-11-22 11:06:37

人类文明的数据存储发展到哪一步了?

人类文明的数据存储发展到哪一步了?

计算机的发明不仅使人类从繁重的脑力劳动中解放出来,而且使信息数据存储的形式发生了根本的变化。华为OceanStor数据存储通过18年的存储管理技术创新和积累,为用户可以提供更高效、更可靠的信息数据存储方式解决方案。

2022-11-22 16:05:47

严选云产品

简道云建筑工程行业零代码开发解决方案 简道云建筑工程行业零代码开发解决方案解决客户、机会、跟进、立项、投标的营销管理方案。同时客户/机会信息统一管理,手机操作方便便捷,以及投标保证金管理闭环,资金去处全程跟踪。同时构建机会→立项→投标→结果的分析管理闭环。
厂站安全态势感知平台 六方云厂站安全态势感知平台AI赋能,自动发现并准确识别工业资产,安全事件精准可控。
阿里云日志服务SLS 阿里云日志服务 SLS 是云原生观测与分析平台,为 Log、Metric、Trace 等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升您在开发、运维、运营、安全等场景的数字化能力。
T6财务、业务、生产一体化管理软件 畅捷通T6财务、业务、生产一体化管理软件,面向生产企业
奇点云金融保险数据智能解决方案 奇点云金融保险数据智能解决方案是面对金融保险机构繁杂多样的数据,提供高效、安全的数据治理解决方案,并提供金融消费者画像, 营销获客、运营优化、风险预警等。
腾讯云连锁健身业态数字化营销解决方案 腾讯云连锁健身业态数字化营销解决方案,从公域到私域,形成客户运营闭环,打造从线上到线下的全流程营销服务平台。丰富的客户数据标签,更了解客户,大幅提升转化率,利用客户行为轨迹大数据以及机器学习算法对客户的互动行为多维评分,智能推荐高潜客户。

甄选10000+数字化产品 为您免费使用

申请试用