icon数字化转型是围绕人、财、务(物)进行的,包括四大步骤+二大目标icon
icon企业数字化转型进程中运维面临的挑战icon

数字化转型是涉及企业全业务、跨职能的系统性改革工程。数字化投资见效慢、周期长,短期内价值难现。云掣助力企业在数字化转型浪潮中在有限投入下快速获得可靠、高质量、有收益的运维能力。

icon企业、云厂商、云服务商分工明确icon

云厂商与云服务商之间分工明确、专业协作,为客户提供稳定可靠的云产品和专业的运维服务。让客户业务运行更稳定更放心。

icon云掣助力企业快速获得可靠的运维能力icon

满足企业各运维领域能力需求,助力企业收益数字化转型带来的多重价值。

icon大数据运维托管服务全景icon
icon大数据运维托管服务技术栈范围icon
icon大数据迁移服务案例:券商大数据平台升级扩容icon
需求痛点
由于初期采用开源Apache Hadoop框架建设分布式计算平台已运行2年之久,集群性能每况愈下。需要基于Cloudera的Hadoop发行版CDH(Cloudera’sDistribution Including Apache Hadoop)构建新平台,迁移核心业务,逐步替代老旧Apache Hadoop。
建设内容
架构设计-根据可用的基础计算资源,规划CDH集群规模和数据节点容量,新集群组件组合部署方案。平台建设-盘点生产环境各组件,根据业务需求完成新平台建设细节规划。安全访问控制-实现Ranger与CDH各组件集成,做到HDFS、HBase、Kafka、PrestoSQL的数据安全访问。系统调优-中文乱码、数组越界、查询报错、通信超时、字段转换失败、任务卡顿、元数据异常、参数解析异常。数据迁移-完成精确到Hive表、字段的PB级全量数据迁移校验。
icon大数据运维托管服务案例:券商大数据集群包年运维托管icon
需求背景

大数据集群安全能力弱,且运行在内网,随着数字化转型的深入,特别新上线的风险集市项目,对集群安全要求、可用性、时效性要求更高,以及其他企业安全问题频发和国家安全法的出台,需要对集群安全升级和严管控。

运维实施

引入kerberos/LDAP、ranger/ranger kms、knox、FreeIPA 实现集群安全管控。组件集成-盘点生产环境各组件,实现安全组件与生产环境各组件集成和适配验证。安全访问控制-实现表列级和服务级数据权限访问控制,多租户访问数据限制,租户只能看自己的数据。数据加密-利用hdfs加密域实现数据透明加密,保证数据安全可视化-界面可视化管理安全组件,认证开关设置。

运维成果

管理安全:多租户访问模式,密钥身份验证,避免未知用户入侵。数据安全:数据透明加密,表列级别权限管控,避免数据泄漏风险。服务安全:组件堆栈级别集中的审计报告以及操作轨迹审计,确保访问行为有迹可查。平台安全:集群网关隐藏内部真实地址,避免爬虫采集集群URL参数信息导致数据外漏。

icon数据库运维托管服务全景icon
icon数据库迁移服务案例:某电商企业迁云icon
需求痛点
电商行业,主营线上购物业务。业务数据量18T,每月增量1T+,大促高峰期业务时长出现白屏卡顿,希望数据库上云,大促业务流畅,支持百万级QPS。数据库节点异常不能影响业务,需要异地灾备,优化数据架构适应应用百万级QPS。
建设内容
MHA ProxySQL+Keepalived+Mysql建设两地三中心云上架构。业务架构优化:数据库实施分库分表,实现一库一表,降低大促单库压力。
项目成果
迁云:上云前后业务不中断,上云过程安全平滑。运维托管:根据云掣10年阿里秒杀架构经验优化客户业务逻辑架构和数据库物理架构,实现亿级秒杀高并发架构,同时性能提升35%,资源成本节省10%。
icon数据库运维托管服务案例:某国际医院单位icon
需求背景
业务最繁忙的时。随着业务量的不断增长,数据库服务资源不足,导致应用响应变慢,业务请求积压,进而导致业务出现故障,系统故障,无法访问。故障处理耗时1小时,严重影响患者就医,社会负面影响大。
运维实施
梳理业务链路,借助统一运维可观测平台实现数据库对外提服链路可观测展示。根据链路快速发现数据库异常出现在哪里,快速发现异常问题,结合日志快速解决问题,避免业务受到感知。
运维价值
故障快恢:问题处理耗时从1小时下降到4分钟。故障预防:结合实时告警和链路监控,提前发现和介入处理数据库性能隐患,月平均故障避免事件10起。性能提升:实现性能提升30%。
icon应用运维托管服务全景icon
icon企业上云icon
icon应用迁移服务案例:金融企业IDC整体搬迁上云icon
需求痛点
该金融企业因国外IDC机房到期,考虑成本和政策以及未来扩展能力,需要把国外IDC机房整体搬迁到国内阿里云上,三套环境涉及资产:261台服务器,REDIS 24套、PG4套、MYSQL24个节点、MQ3套、13个VPC等。
建设内容
调研:通过调研规划云上资源数量和规格配置,云产品选型。方案:根据调研结果分析、客户需求和场景设计出平滑上云方案。
项目成果
迁云:上云前后业务不中断,上云过程安全平滑。客户收益:性能提升20%,增强横向扩展能力,资源成本节省40%以上,年平均解决成本400w。
icon应用运维托管服务案例:服装品牌DevOps实践icon
需求痛点
全国门店2000多家,有四大物流基地,两个机房,80+台左右物理服务器, 200+台虚拟服务器,涉及ERP系统、OA、HR、财务等系统。为配合集团数字化运营战略,实现全业务DevOps体系和跨云能力建设。
运维实施
调研:梳理现有业务系统情况,资源规模以及业务架构。DevOps落地:引入DevOps体系,应用容器化改造、微服务化改造、蓝绿发布改造,依托DevOps体系构建混合云,赋能跨云支持能力。
运维价值
蓝绿发布:发布耗时由改造前2-3小时下降到改造后的10分钟内,回滚由改造前2-3小时下降到改造后的5分钟内。K8S容器化:资源成本下降35%,提高资源利用率和横向扩展能力以及成本控制。DevOps能力:实现业务敏捷开发和运维对外赋能。
icon云掣运维托管服务优势icon
专家团队全栈覆盖
专业团队:成长于原生数据平台产品团队,更专业。10+阿里云MVP专家;全域覆盖:覆盖多个大数据领域的全栈技术服务能力。
运维平台高效支撑
ACOS:轻松建立起业务和基础平台的可观测性能力;EasyManager:开源大数据计算集群的自动化部署、监控和运维工具;运维数字化大屏:直观展示运维数字化信息,指导运维工作开展。
解决方案丰富多样
运维可视化解决方案
DevOps解决方案
基于EasyMR的大数据运维解决方案
云上Oracle RAC解决方案
企业服务专业及时
覆盖能力:累计服务1000+客户,覆盖30+行业;服务能力:年处理事件量26000+,托管数据平台节点量15000+,平均响应时间<10分钟。
icon云掣运维解决方案优势icon
icon运维服务整体流程icon
服务接入期
目标:服务顺利接入启动
服务启动会议
成立专业服务团队
明确客户对接人员
对齐服务目标和范围
服务内容、标准、流程介绍及培训
建立日常沟通机制渠道
资源信息搜集整理
必要账号授权
服务建立期
目标:服务体系正式建立
监控接入,建立可观测 模型
全面体检,摸排系统环境运行情况
针对体检结果,进行整体一次性优化
运维安全隐患排查加固
建立服务报告制度
环境部署*
数据迁移*
服务保障期
目标:业务连续性保障
7*24小时监控处理
定期巡检
日常技术咨询
组件性能优化
数据备份维护
定期安全检查
安全漏洞修复
故障应急处理与复盘
服务提升期*
目标:降本增效,服务升级
成本分析和优化
资源使用分析和优化
系统架构调整和优化
系统性能优化
高可用、灾备演练
新技术引进和探索
icon问题处理流程icon
icon服务规范&流程icon
安全基线规范
操作系统安全基线 阿里云云平台安全规范
信息安全规范
账号信息、账号密码、敏感信息、客户账号信息
操作规范
客户当前云环境主机、操作系统、大数据平台操作规范
故障/应急流程
发现故障,初步判定,应急预案,在线工程师处理,故障恢复,总结报告
变更流程
变更请求,变更判定,评估影响,变更审批,文档更新
icon标准化服务规范&流程icon
5*8日常运维服务
平均响应时间10分钟以内
限时4小时内提供解决方案或者解决
保证全年95%以上的服务响应率
7*24紧急运维服务
平均响应时间15分钟以内
限时4小时内提供解决方案或者解决
保证全年95%以上的服务响应率
icon公司资质和荣誉icon
icon客户数字化转型的选择icon
产品推荐 查看更多>>
    KC-BMS营业部集中管理系统

    KC-BMS营业部集中管理系统总分监管模式,实现对营业部系统的统一监管;支持营业部的拓扑管理;实时监控营业部运行状态,并按信息内容将告警分发至总部。营业部业务系统的统一升级, 流程化定时开关程序,营业部设备、应用定时巡检;统一管理营业部脚本下发。

    高效稳定

    安全可靠

    同创永益IStorM DR容灾运维管理台

    同创永益IStorM DR容灾运维管理台可以在业务连续性体系建立过程中,结合容灾环境的全局一体化监控和场景预案定制,实现容灾演练过程流程化管理,切换过程自动化实现,结合可视化指挥视图,形成统一的灾备管理工作支撑平台,并结合业务视角定期评估,持续改进,充分提升IT价值和业务连续性,助力企业客户治理现代化和服务智慧化。

    预案中心

    容灾管理

    演练中心

    灾难恢复能力评估

    阿里云运维安全中心

    云盾堡垒机是一个核心系统运维和安全审计管控平台。在为操作人员提供统一的运维入口,解决分散登录难于管理的问题的基础上,集中了运维身份鉴别、职权管理、系统操作审计等多种功能。并可对常见运维协议的数据流进行全程记录,通过协议数据流重组的方式进行录像回放,达到运维审计事后追溯的能力。

    审计管控

    职权管理

    精准访问

    身份鉴别