离线开发平台

一站式离线开发平台(BatchWorks),包括数据采集、数据开发、数据运维等全链路数据处理单元,屏蔽底层组件复杂度,快速搭建数据平台底座

产品功能
多源异构数据同步
袋鼠云自研的分布式数据同步工具,可在十多种异构数据源之间进行读写,支持插件式扩展,数据同步更简便
 
数据开发
丰富的任务类型,SQL语法/表/字段提示、UDF管理等特色功能,提供舒适高效的开发体验
任务调度
支持多种粒度的周期性调度,上下游依赖性任务调度,具备丰富的系统参数
 
任务运维
对任务运行状态进行监控,快速批量进行数据处理,实例管理等功能,支持多样的告警规则,急速报错,提高整体运维监控效率
产品优势
节省80%数据开发时间
一站式数据开发,覆盖数据采集、数据处理、调度依赖、任务运维、自动化元数据管理等场景,实现数据需求的敏捷响应
 
兼容开源、商用计算引擎
适配Hadoop、MPP、RDBMS等不同架构、规模、品牌的计算引擎
 
 
 
高性能分布式调度引擎
支持百万级别任务的复杂调度,具备周期性、依赖性、优先级等多种调度配置
 
数据同步引擎(FlinkX)
基于分布式架构设计,提供Web界面化配置能力+高性能的数据同步服务
实时开发平台

实时开发平台,基于Apache Flink的一站式大数据流式计算平台,覆盖流式数据开发全链路流程。亚秒级处理延时,支持Flink SQL开发,丰富的运维监控路线,助理企业实时化转型

产品功能
实时采集
实现关系型数据库、Kafka等多种不同数据源的实时采集,与实时计算开发过程无缝衔接
 
 
SQL化开发
无需关注底层Flink技术栈,提供SQL语义的流式数据分析能力(Flink SQL),源表/维表/结果表可视化配置,多种维表缓存策略,提升实时计算性能
算子化
支持SQL任务算子化开发,通过可视化拖拽方式实现作业开发;一键SQL代码转换,方便查看算子结构,支持更丰富的场景覆盖
 
运维监控
多维度性能指标曲线,作业健康状态实时掌控;支持添加自定义metric,支持多种实时告警规则
产品优势
性能优越
作业可达百万吞吐,计算可达秒级延时;关键性能指标超越Storm性能6到8倍
 
稳定安全
Exactly-Once语义保证数据计算有且处理一次,不重不丢,数据质量严格保障
 
 
金融级流式数据处理组件
功能强大,具备Flink源码增强及改造能力,自研FlinkStreamSQL、FlinkX组件,已部分开源
 
简单易用
SQL无需学习门槛,开箱即用,支持图形化开发,集成流式开发、调试、运维、监控,方便易用
算法开发平台

算法开发平台,集可视化建模与交互式代码编写于一体的企业级数据科学平台,支持从数据接入、数据处理、模型开发、模型训练到模型部署的全链路流程,提供安全、稳定的分布式算法运行环境

产品功能
可视化实验建模
实现从数据接入到模型评估的全链路可视化开发,便于非开发人员理解模型、快速上手
 
 
交互式Notebook建模
集成JupyterLab,可进行Python、Pyspark、R语言的交互式算法开发,自由进行数据探索
 
模型周期性训练
对接调度引擎,完成算法任务的周期性调度,进行模型周期性训练,并支持模型版本管理
 
模型在线部署与调用
支持模型在线部署,以API方式对外提供模型服务
产品优势
兼容主流计算框架
兼容主流机器学习与深度学习框架,满足多维计算场景
 
算法组件丰富
封装多类算法组件,快速搭建算法场景,提供算法建模能力
算法建模难度低
通过拖拉拽算法组件可视化建模,降低算法建模难度
 
算法能力工程化
工程化封装模型训练与部署能力,提供企业级算法服务能力
产品推荐 查看更多>>
    Tableau Server

    使用Tableau Server实现受管控的大规模自助式分析。

    处处可用

    覆盖所有数据

    灵活部署

    达观智能推荐引擎

    达观首创“召回+排序+后处理”三段式推荐流程,可根据业务场景和规则对各个流程进行推荐策略配置,最大化推荐系统的自主操作性。

    应用广泛

    功能完备

    Tableau Desktop

    Tableau Desktop让您能以全新的方式查看自己的数据。在短短几分钟内完成关键业务问题的探索与回答,然后与他人分享见解。

    实时传送

    安全可靠

    快速获取