立即咨询

电话咨询

微信咨询

立即试用
商务合作

你不知道的哪些关于数据存储的知识

2022-11-22

 

    本篇文章主要谈一下MySQLHBaseES这几种数据存储的主要知识。

    MySQL,关系型数据库。主要面向OLTP,支持事务,支持二级索引。支持sql,支持主从、Group Replication架构模型。

    HBase是基于HDFS,支持海量数据读写,尤其是写。支持上亿行、上百万列的,面向列的分布式NoSql数据库,天然分布式,主从架构,不支持事务,不支持二级索引,不支持sql

    ES是一款分布式的全文检索框架,虽然ES也提供存储,检索功能,但我一直不认为ES是一款数据库,底层基于Lucene实现。但是随着ES功能越来越强大,与数据库的界限也越来越模糊,天然分布式,p2p架构,不支持事务,采用倒排索引提供全文检索。

    MySQL采用行存储,HBase是面向列的NoSql数据库,解释了行、列存储的区别。至于ES,我也说不清楚它是什么存储方式,暂且叫它索引存储吧。

    MySQL中要提前定义表结构,数据以行为单位组织在一起的,假如某一行的某一列没有数据,也需要占用存储空间;也就是说表共有多少列(属性)需要提前定义好,并且同时需要定义好每个列所占用的存储空间。

    HBase则是以列为单位存储数据,每一列就是一个key-valueHBase的表列(属性)不用提前定义。列可以动态扩展,比如人员信息表中需要添加一个新的“address”字段,MySQL需要提前alter表,HBase的话直接插入即可。

    ES比较灵活,索引中的field类型可以提前定义。也可以不定义,如果不定义,会有一个默认类型,不过出于可控性考虑,关键字段最好提前定义好。

    MySQL依然会为该字段保留空间,因为后续有可能会有update语句来更新该记录,补上sex内容;简单的展示了数据在MySQLHBase中存储差异,和真实的情况还有差距,可以看到即使第二条记录的sex字段为空,而HBase则是把每一列都看做是一条记录,row+列名作为keydata作为value,依次存放。假如某一行的某一个列没有数据,则直接跳过该列。对于稀疏矩阵的大表,HBase能节省空间。

    说完MySQLHBase,这里要重点说一下ESES的存储方式和上面两个都不一样,MySQLHBase是将数据按不同的方式进行存储。好歹它们存的还是数据,而ES则存的是倒排索引。

版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

探域电商全域智能客服机器人探域电商全域智能客服机器人,以消费者触点为核心,助力品牌全域数智化运营,实现高质量增长。我们通过AI人工智能、NLP技术和行业知识图谱的核心技术,构建了营销服务一体化智能客服机器人、全域客户数据中台 Lite CDP、私域一体化智能营销SCRM等核心产品。
尘锋SCRM系统尘锋SCRM系统传统客户关系管理的基础上,引入社交平台的好友关系,为各行业企业主提供更全面的客户画像洞察,更准确的业务决策分析,更有效的客户运营手段。帮助企业在获客、转化、运营3大环节显著提效,助推企业业绩的持续增长。
百度智能云客悦智能客服系统百度智能云客悦智能客服系统作为百度智能对话平台的一次重大升级,基于大模型完成企业级对话平台重构,提供高效搭建任务对话、知识问答、人设闲聊等AI原生Agent的能力,帮助企业高效开启大模型智能对话全新体验,为智能对话系统的发展树立了新的里程碑。
北森盘点与发展系统北森盘点与发展系统,基于人才九宫格、人才名单结果,选拔高潜后备人才进入人才库,给予锻炼机会,加速成才。根据能力模型制定关键人才培养框架,根据盘点结果制定针对性的发展计划。评估角度多维度立体,适应企业现状,契合业务需要。
黑湖智造MES系统黑湖智造MES系统,云端协同生产,让数据驱动制造,入口级工业协同平台,构建立体的数字工厂。贯穿生产全流程,实现模块化全链路数字管理,基于微服务,灵活适配不同业务模式。
为你推荐
直播间在线人数卡在500上不去?天志互联抽盒系统从互动率破局

抖音算法推流核心指标是互动率而非GMV。天志互联直播抽盒系统从订单秒级上屏、一键拆盒、氛围引爆三个维度拉高互动率,驱动算法推流的正循环。

2026-06-26
品牌联名越做越亏?天志互联用游戏化体验共创重新定义IP营销

从"换皮联名"到"游戏化体验共创"——拆解彩棠敦煌联名案例的壁画修复小游戏设计逻辑、奶茶品牌联名翻车教训和中小品牌三条低成本高ROI的IP联名路径。

2026-06-26
一个人也能搭游戏化运营体系?低代码时代品牌运营的乐高式搭建指南

低代码时代品牌游戏化运营体系的"乐高式"搭建指南——从选模板、搭积分闭环、数据迭代到多活动并行管理和团队交接的全流程实操方法。

2026-06-26
私域社群打开率跌破3%以后:一个快消品牌的游戏化自救实验

一个快消品牌用游戏化方法三个月救活240个死群的完整复盘——从签到排行榜、互动任务、习惯养成到赛季制防疲劳的六周运营节奏拆解。

2026-06-26
品牌私域裂变怎么设计才不被骂?游戏化社交裂变的三个底线原则

游戏化社交裂变的三个底线原则深度拆解——让转发不像广告、让奖品有炫耀价值、给用户不转发的自由,加3%超级用户识别策略和三个常见翻车点避坑指南。

2026-06-26
查看更多