icon云计算和物联网时代下IT基础监控面临的挑战icon

近年来,数字经济浪潮席卷全球,由此而驱动的企业数字化转型在各行各业如火如荼的进行着。IT在数字化转型中扮演着重要的角色—— IT部门需要为企业的业务转型提供技术保障,并支撑企业IT系统的建设、维护以及运营。

监控要求高 工具成本高 监控人员少
监控设备繁多化

如何有效管理大规模、品牌各异的设备资源

问题定位困难

突发应急问题如何快速预警、发现、定位、排查

设备分布广泛化

多中心、多机房设备如何高效管理

传统工具响应缓慢

传统工具如何应用多样化IT资源管理要求

监管模式集中化

如果实现不同资源统一管理

开源工具使用复杂

运维人员少,事情多,工具使用要求高,如何提升易用性

icon新一代数字化基础监控产品DOIMicon

云智慧新一代数字化基础设施监控(Digital Operation Infrastructure Monitoring)对IT基础设施实现监、管、控⼀体化的监控运维管理,是基于云架构的基础设施监控平台,具有良好的扩展性、管理性、稳定性,可以随着企业的扩大、监测内容的增多而无缝扩展,自动化地管理、展示、预警及告警。

云智慧基础设施监控(DOIM)的特色
全栈基础监控:服务器、网络设备、存储、虚拟化、视频、动环、流量、无线设备、IP地址管理、自动化巡检。
自主创新:从前台页面展示、到后台数据处理和存储等核心技术全部都是云智慧公司自主开发。
云监控平台:无论是从底层的数据库开发还是平台、架构、部署的设计都满足云平台的要求,产品具备弹性结构,实时无缝扩 展云监控服务的范围。
快速灵活部署模式:针对数据中心或者海量监控来说,云智慧运维监控平台有着快速部署,自动化管理的绝对优势,用户只需 通过四步即可搭建一套统一监控平台,额外通过四步可以无缝扩展监控范围。
开放集成平台:云监控平台集成主流、常见的监控服务类型,通过插件智能的识别所要监控的资源的实时运行动态,用户不需 要考虑监控服务的厂家、类型、操作系统、CPU类型等资源。
icon新一代数字化基础监控–以用户为中心,全面提升用户体验icon
icon基础设施监控(DOIM)技术优势-高可靠性icon
动态负载均衡

监测云中的服务器根据数量和 计算能力动态承担各自的监测 任务,当数量和计算能力发生 变化时,通过自动调节机制去 重新调整各自的监测任务量。

可靠双机热备

两台主控制台服务器组成高效的 “主”—“备”模式,“主”服 务器和“备”服务器之间通过 “智能心跳”技术实时关联,一 旦主控制服务器宕机,备份服务 器马上启动执行任务。

多机容灾备份

监测云和存储云中的多台服务器实 现多机容灾互备,如果监测云和存 储云中有服务器宕机,这些服务器 的监测任务马上就会被重新分配到 其它正常运行的服务器上,保证了 监控的连续性。

icon基础设施监控(DOIM)技术优势–高性能+灵活扩展icon
icon基础设施监控主要功能icon
icon一体化综合监控icon

平台支持服务器、应用及业务、网络设备、存储设备、虚拟化及自定义监控,内置数百种常见设备监测器、上万个监测指标。

icon一体化综合监控icon

• 服务器监控 • 网络设备监测 • 安全设备监测 • 存储设备监测 • 虚拟机监测 • 物联网监测 • 流量监测 • 网络拓扑

icon服务器硬件监控icon

对所有支持管理口IPMI及SNMP协议的服务器硬件进行监控,浪潮、华为、联想、曙光、紫光、华三等国内厂商通过管理口IPMI及SNMP获取硬件状态指标,IBM、HP、DELL等国外主流厂商服务器通过管理接口获取硬件状态指标。

icon操作系统监控icon

可监控各类 Windows、Linux、UNIX等操作系统,支持麒麟、凝思、深度等 国产操作系统,支持Agent方式采集监控数据,支持多种协议方式采集数据(SNMP V1、V2、V3,WMI, SSH等)。

icon存储监控icon

支持对IBM、DELL、HP、华为、浪潮、联想厂商存储设备的实时监测,通过SNMP协议或厂商接口采集数据

icon虚拟化设备监控icon

支持对对VMWARE、Hyper-V、XEN、深信服、华为、华三等主流厂商的虚拟化监控,通过虚拟化厂商的管理接口,获取各项监控数据。

icon中间件监控icon

支持Tomcat、Weblogic、WebSphere、MQ、JBOSS、Docker 等各种中间 件、容器监控

icon数据库监控icon

支持Oracle、SQL Server、Mysql、MongoDB、达梦等各类关系型数据库与No SQL数据库平台监控。用户可以自行根据SQL语句的返回结果来定义监测。

icon一体化拓扑管理,多方位信息呈现icon

直观显示网络、服务器、存储等设备图标及连接关系。图标及链路状态可通过不同颜色实时显示。支持自定义拓扑,帮助用户定义关键设备和关键链路。可设置拓扑背景为GIS地图,并提供全屏、放大、缩放、导出。设备信息、性能、告警信息关联,链路属性、流量、性能信息关联。

icon配置管理icon

IT资源配置变更、配置备份、配置对比管理、配置查询及统计分析

icon无线设备监测 icon

监控无线AP/AC设备状态,通过筛选MAC、名称、状态等快速搜索无线设备,展示一段时间内不同的场景下的在线用户数和活跃热点数。

iconIP地址管理icon

可进行子网扫描,自动发现IP地址。可查看IP地址与MAC地址的对应关系,以及IP地址的使用、分配、保留情况。提供IP 地址详情面板,列出所有可用IP的状态和类型,以及是否30天内活跃。

icon实时监控网络配置和变更,加快故障诊断速度icon
动力监控
UPS、蓄电池、配电柜、发电机、精密空调等 3D机房可视化
环境监控
机柜微环境、漏水检测、温湿度、新风机等
安防监控
门禁、音视频系统、防盗设备、消防设备等
资产管理
资产管理维护,设备型号、编号、空间分布位置等
icon视频摄像头监测icon

针对视频监控故障排除延迟严重,事件无法及时响应,有限人力很难支撑;设备模式标准多样,维保模式效率低下,维保服务相当困难;现行维保技术落后,工程人员信息不畅等情况。系统通过摄像头监测手段进行针对视频监控设备的运行监管。对摄像头质量检测项如:白屏、花屏、蓝屏、黑屏、图像质量差(偏色、冻结、遮挡、抖动、雪花、条纹、卡顿等)、离线等。

icon机房温湿度监控icon

通过已经部署好的温湿度传感器采集数据,进行统一监控

icon机房烟雾、漏水监控icon

可监控机房内多处烟感和漏水检测绳返回的烟感和漏水状态数据

iconUPS监控icon

可监控UPS电压、电流、频率、温度等

icon资产管理icon

IT资产清单、信息变更、维保记录、资产盘点、清理报废、资产统计综合管理及多维度分析

icon丰富的视图、报表和统计icon

全面了解IT资源使用情况,帮助实施IT规划和投资。状态视图,监测视图,告警视图,设备视图,流量报表,TopN报表,巡检报告,历史告警,监测点趋势图,设备树形图,实时报告。

icon国家某网办-多数据中心监控项目icon
建设背景
国家某网办负责包括落实互联网信息传播方针政策和 推动互联网信息传播法制建设,指导、协调、督促有 关部门加强互联网信息内容管理,依法查处违法违规 网站等。国家某网办深圳和北京共四个数据中心,承载网信办 的各项重要业务。数据中心共有服务器主机、存储设 备、网络设备、安全设备等共计2万多IT设备,设备 维护量大,运维人员少。运维流程不统一、纸质工单+人工审批,工单处理周 期长,绩效无法评估。急需一套分布式集中监控系统,提升运维效率,为各 数据中心正常运行提供保障。
需求与挑战
1、超大规模监控带来的性能要求 原有监控系统在监控设备达到千台规模时,已出现页面报表响应缓慢,告警 延迟等问题。本次监控设备达到万级规模,性能压力巨大 2、多数据中心的集中管理要求 多个数据中心跨地域分布特点对运维集中管理统一化要求带来挑战。同时随 着业务扩展,监控系统要支持弹性扩展 3、从分散式运维管理转变为统一运维管理 如何在各个数据中心建立工单、排班、巡检的统一管理体系,实现统一、高 效的管理,并可进行业绩评估和知识积累 4、资产设备繁多化带来精细化资产管理需求 管理设备数量众多、品牌、型号、协议类型繁多,关系复杂,如何通过可 视化需求确保资产安全、使用安全、运行高效。
icon国家某网办–多数据中心监控项目icon
icon某能源集团-全国加油站系统监控icon
项目背景

加油站网点数量多且遍布全国,网络传输 方式多样,发生故障后,社会负面影响大。管理内容:监控全国32个省市,超过16000个站 点。管道管理系统、油库物流系统 IT 设备 监控、 所有B/S架构的业务系统,总 部及下属100多个分、子公司的所有 站点及其它核心业务。客户化定制开发。 大规模+高可靠+定制化要求

解决方案

针对运维监控需求的高性能数据库。极小化网络资源消耗的分布式架构:本地处理监控数据,只将状态数据和告警 信息上传。数据传输前高压缩处理。数据先存入缓存,定期写入CCU。定制化告警:两种短信告警方式同时使用:内部Web短 信网关 + 美信无线MODEM网关。故障分级告警:一级告警发送给现场服务 工程师,二级告警发送给业务主管工程师, 三级告警发送给各信息处长。高性能自主研发数据库+分布式架构+定制化告警

客户收益

服务于16个业务部门、59名工程师。监控100+业务系统、2000 +台设备。20000+监测点、10万+指标参数。每天10几次不同级别声音、每周200多条短消 息。每月40,000,000条数据信息。可靠保障业务系统及设备稳定运行 优化告警方式提升故障处理效率

icon某能源集团-全国加油站系统监控icon
icon某三甲医院-II及动环设备一体化管控icon
一体化综合运维解决方案
服务内容:监控机房的烟感、温感、漏水、UPS、空调等动力环境状 况;监控各系统的服务器、操作系统、网络设备、数据库、中 间件等IT软硬件设备;紧急告警自动触发预设置的程序和脚本,实现自动处理;APP端支持安卓和IOS系统,在手机端查看管理的业务和设 备状况。
客户状况和收益
医院在使用自动化监控系统之前,主要靠人工巡检,通常是发生问题, 影响业务使用时,IT 部门才能得到通知,派人去解决问题。由于业务 不能中断,运维人员经常夜间需要去机房解决设备问题,而其中很多 问题都是重复性出现。自动化巡检代替人工巡检,监管控一体化使运维更轻松。对机房动环和IT设备统一监控,主动发现问题快速解决问题。实现手机端随时随地运维。实现特定的自动化操作,代替运维人员大部分夜间应急工作。
icon某交通公司-全省高速公路统━监控icon
解决方案和服务
服务内容:实现对各业务系统的设备,包括各路段上云工程、视频联网云服务、视 频会议系统、加油站管理系统、收费站管理系统等业务的监控,监控范围包 括IT软硬件以及摄像头、ETC设备、工控机等设备的统一监控。未来方向:某高速是全国高速公路IT管理先进单位,统一监控是其IT管理的重要部 分,未来这种先进的管理方式将推向全国。
客户状况和收益
客户IT管理规模大、设备类型多、监控地域广:某交通集团下属20条省内高速公路和多家控股公司,全省各条高速400多收费站,加上对各个管理部门、加油站等,涉及的管理单位有数百家,各个单位 有自己的 IT 设备、智能设备、专用设备。实现在云平台对全省设备的统一监控:管理部门用GIS形式,可以统一查看全省各条高速公路、各个路段、收费站、 加油站设备位置和状态。故障发生1-2分钟,运维人员即可接收到告警,重点监控指标出现问题,5秒 即可接收到告警,立即定位故障点,实现了实时监控。
产品推荐 查看更多>>
    壹合原码智能化楼宇自控施工系统

    壹合原码智能化楼宇自控施工系统,基于多年沉淀的深度学习技术及强大的专家团队,针对多个工业垂类场景进行算法优化,打造最优的工业AI算法模型,提供更加精准的工业AI模型库,客户可直接选择适合自己业务场景的模型,快速实现业务落地 。

    人工智能AI

    无人值守智能巡检

    全感知设备接入

    工业AI算法

    阿里云监控

    阿里云监控,一键安装、自动安装,每秒采集、15秒聚合上报。30+监控指标,非阿里云主机支持,基础云产品监控。阿里云监控和日志服务结合, 推出了非常轻量级,但全面、易用的解决方案-日志监控。持SDK(java),OpenAPI,和阿里云命令行工具(CLI)三种上报方式。

    监控指标

    聚合上报

    轻量级

    日志监控

    KC-ADM软件分发配置系统

    KC-ADM软件分发配置系统优化软件分发部署过程,打造科学智能的数据中心,减少操作的随意性,防止误乱发,路径不一致。成倍提高操作效率,规模越大收益越高, 部署过程透明化、自动化。

    安全可靠

    功能完备