你不知道的哪些关于数据存储的知识

来源: 云巴巴 2022-11-22 11:05:58

 

    本篇文章主要谈一下MySQLHBaseES这几种数据存储的主要知识。

    MySQL,关系型数据库。主要面向OLTP,支持事务,支持二级索引。支持sql,支持主从、Group Replication架构模型。

    HBase是基于HDFS,支持海量数据读写,尤其是写。支持上亿行、上百万列的,面向列的分布式NoSql数据库,天然分布式,主从架构,不支持事务,不支持二级索引,不支持sql

    ES是一款分布式的全文检索框架,虽然ES也提供存储,检索功能,但我一直不认为ES是一款数据库,底层基于Lucene实现。但是随着ES功能越来越强大,与数据库的界限也越来越模糊,天然分布式,p2p架构,不支持事务,采用倒排索引提供全文检索。

    MySQL采用行存储,HBase是面向列的NoSql数据库,解释了行、列存储的区别。至于ES,我也说不清楚它是什么存储方式,暂且叫它索引存储吧。

    MySQL中要提前定义表结构,数据以行为单位组织在一起的,假如某一行的某一列没有数据,也需要占用存储空间;也就是说表共有多少列(属性)需要提前定义好,并且同时需要定义好每个列所占用的存储空间。

    HBase则是以列为单位存储数据,每一列就是一个key-valueHBase的表列(属性)不用提前定义。列可以动态扩展,比如人员信息表中需要添加一个新的“address”字段,MySQL需要提前alter表,HBase的话直接插入即可。

    ES比较灵活,索引中的field类型可以提前定义。也可以不定义,如果不定义,会有一个默认类型,不过出于可控性考虑,关键字段最好提前定义好。

    MySQL依然会为该字段保留空间,因为后续有可能会有update语句来更新该记录,补上sex内容;简单的展示了数据在MySQLHBase中存储差异,和真实的情况还有差距,可以看到即使第二条记录的sex字段为空,而HBase则是把每一列都看做是一条记录,row+列名作为keydata作为value,依次存放。假如某一行的某一个列没有数据,则直接跳过该列。对于稀疏矩阵的大表,HBase能节省空间。

    说完MySQLHBase,这里要重点说一下ESES的存储方式和上面两个都不一样,MySQLHBase是将数据按不同的方式进行存储。好歹它们存的还是数据,而ES则存的是倒排索引。

版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

浅析关于数据存储之直接附加存储DAS

浅析关于数据存储之直接附加存储DAS

DAS即Direct Attached Storage,中文是直接附加存储,DAS这种存储方式与我们普通的PC存储架构一样,数据存储设备是整个服务器结构的一部分,外部存储设备都是直接挂接在服务器内部总线上。

2022-11-22 11:02:23

存储海量数据解决方案之数据存储云平台

存储海量数据解决方案之数据存储云平台

不得不说,科技屡屡创奇观,甚至奇迹,因此坚定了我们对于它的信仰。你可能还没有听说过什么是数据存储云平台,但是我相信数据存储云平台在以后一定会对我的的生活有越来越大的帮助。 数据存储云平台类型产品,在2020年增长约30%,随着大数据、云计算、物联网等新技

2022-11-21 10:33:37

人类文明的数据存储发展到哪一步了?

人类文明的数据存储发展到哪一步了?

计算机的发明不仅使人类从繁重的脑力劳动中解放出来,而且使信息数据存储的形式发生了根本的变化。华为OceanStor数据存储通过18年的存储管理技术创新和积累,为用户可以提供更高效、更可靠的信息数据存储方式解决方案。

2022-11-22 16:05:47

阿里云云服务器中快速存储数据信息的秘密是?

阿里云云服务器中快速存储数据信息的秘密是?

云服务器在使用的同时经常会遇到的安全方面的问题有哪些?比如说云服务器中的信息遭到窃取或者是遭到外来攻击之后云服务器中的数据信息造成了泄露,这些都是我们使用云服务器时经常会遇到的安全方面的问题。

2022-11-24 10:18:15

新一代的数据存储技术到底有多强大?

新一代的数据存储技术到底有多强大?

云存储是目前发展最为迅猛,远远超过了其他大数据应用的发展速度,必将是未来数据应用的重要组成部分。另外,数据分层、数据存储、融合以及智能也将逐渐普及应用,可以说,安防行业为满足大数据的到来,已经做足了准备。

2022-11-22 16:06:07

海量数据存储的表结构优化是什么样的

海量数据存储的表结构优化是什么样的

现在,无论是工作还是学习,都要使用网络,海量数据存储系统是网络系统的升级版,海量数据存储可以有效解决目前面临四大安全威胁。要建立一个完善的海量数据存储防护管理体系,必须从客户端软件、邮件服务器端安全、安全邮件信息服务提供商等各个企业方面可以采取一些相应的技

2022-11-21 10:34:48

严选云产品

京灵平台企业灵活用工平台 灵活用工与传统劳动关系不同,灵活用工是自由职业者自带生产资料、以个人经营者的身份与用工需求方建立合作关系,并获取相应报酬的合作式用工模式。基于灵活用工场景,为企业提供灵工发佣及个税缴纳解决方案的服务平台。针对行业痛点,与国内领先的、风控出色的合作伙伴一起,为企业服务。
数据管理平台 为企业范围内的数据采集、存储和管理建立了一套统一、开放、集成的一体化平台,该开放型数据管理平台可集成工厂所有的过程数据、经营管理数据并支持相关的应用。
晴空猎鹰舆情系统 以网络舆情监测分析平台为载体,通过信息技术和人工智能技术,实现对网络舆情信息的实时监测。
同创永益IStorM storage智能存储分析管理平台 同创永益IStorM Storage 智能存储运维分析管理平台以自动化、可视化的方式实现异构复杂存储环境下存储资源池的智能化管理,降低存储管理风险。统一、集中的对存储资源进行监控,提升存储运维管理的效益和价值。
北极星OKR数字化目标管理工具 北极星OKR数字化目标管理工具,上下目标一致,聚焦重点项目,保证垂直方向和水平方向的高度对齐。团队成员之间,团队与团队之间基于共同目标彼此协同,实现1+1大于2的化学效应。更大程度地释放员工个人内在工作热情,愿意发自内心地付出更多超越职责的努力。
税务云 为小微纳税人(起征点以下的小规模纳税人及个体工商户)提供基于网络的发票业务云服务

甄选10000+数字化产品 为您免费使用

申请试用