SAS可视化建模统计工具的特性

来源: 云巴巴 2019-10-28 16:38:29

探索性建模(可通过SAS可视化分析探索获得)

  • 在大型数据集中,快速解读复杂联系以及重要变量对预测建模产出的影响。

  • 了解单个变量对模型整体提升度的影响。

  • 侦测异常值和/或影响因子,让您可以在后续分析中判别、捕获和删除它们。

  • 图形化的数据探索,包括条形图、柱状图、箱图、热力图、气泡图、地图和更多图形(使用SAS可视化分析探索)。

  • 根据相关矩阵、散点图和热力图和箱图直接派生出新的模型。

  • 得到预测输出或细分结果,可直接应用到其它建模或可视化任务中。得到的输出可以存储和传送给缺少建模能力的用户使用。

  • 生成模型评分代码。如果某个模型包含从其它模型(如叶节点、聚类节点等)产生的输出,将自动连接起来生成评分代码。

交互式的描述性建模和预测建模技术

  • 过滤观测。

  • 交互式去除异常值,模型自动重新拟合。

  • 用户自定义的事件水平。

模型自动更新,包括如下建模技术:

  • 聚类

    • k-均值聚类。

    • 用于评估聚类成员关系的轮廓图。

    • 输入变量的散点图,用于反映小数据集的聚类特征;以及反映大数据集的聚类特征交叠的热力图。

    • 可以出处聚类群组变量,用于进一步分析。

    • 详细的汇总统计(各聚类的均值、每个聚类的观测个数等等)。

    • 生成按需聚类节点作为一个新的列。

  • 分类树

    • 基于C4.5算法(信息增益或信息增益比率)。

    • 树的交互式生长或修剪。

    • 设置树的深度、最大分支数、叶子大小、修剪的强度等等。

    • 对变量进行分箱处理,可自行决定分箱个数。

    • 可通过为树图或概览图来交互式地探索树的结构。

    • 生成按需聚类节点作为一个新的列。

  • 广义线性模型

    • 支持各种统计分布,包括beta、normal、binary、exponential、gamma、geometric, Poisson, inverse Gaussian 和 negative binomial。

    • 设置收敛和迭代条件。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型汇总、迭代历史、拟合统计、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 逻辑回归

    • 使用logit和probit链接函数来对二值数据进行建模。

    • 影响统计量。

    • 变量选取。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型维度、迭代历史、拟合统计、收敛状态、第三类检验、参数估计和相应剖面。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测标签和预测事件可能性并作为新的列。调整预测阈值,以标记某个观测是否为事件。

  • 线性回归

    • 影响统计量。

    • 变量选取。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括方差分析、模型维度、拟合统计、模型方差分析、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 分组处理

    • 针对每个群组,构建模型、计算和处理结果,无需每次进行数据排序或建立索引。

    • 在决策树或聚类分析中立即建立基于群组的模型(例如:分层建模)。

  • 模型评估与比较

    • 生成模型比较汇总信息,例如提升图、ROC图、一致性统计和误分类率等评价指标。

    • 交互式地滑动调整预测阈值,用于自动化更新评估统计和误分类率指标。

    • 针对不同分位数,交互式评估提升度。

  • 模型评分

    • 将模型导出为SAS数据步代码,从而与其它应用进行整合。如果某个模型包含从其它模型得出的输出,将自动连结评分代码。

高扩展性内存处理

  • 内存分析引擎SAS LASR分析服务器 (the SAS® LASR Analytic Server) 提供了一个安全、可扩展的多用户环境。

  • 只需一次将数据读入内存,就可以持续支持多用户的实时交互处理无需将数据写入磁盘,也无需在不同分析步骤中对数据重排。

  • 支持单服务器模式(适用于小的部门团队),也支持分布式环境,从而支持多节点多线程的高性能处理。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

7月技术周|基于SDN网络的优化技术和QoS研究分析(一)

7月技术周|基于SDN网络的优化技术和QoS研究分析(一)

随着网络技术的发展,越来越多的分布式应用和不同类型的网络技术被部署到网络上,基于传统IP的网络体系结构正面临越来越多的问题,传统的优势正逐渐成为制约网络技术发展的瓶颈。 由于篇幅较长,文章将分成四篇进行讲解,本文为第一篇,欢迎关注阅读并留言讨论。

2022-11-21 17:11:01

干货 | 钢企决策智能系统案例分享

干货 | 钢企决策智能系统案例分享

傲林科技以傲数平台、事件网两大平台产品为支撑,打通采购、生产、库存、销售、订单、营销的企业经营全流程数据,从企业经营全局进行数据分析,通过量化决策系统,帮助客户实现矿石成本平衡优化、企业量化决策优化、企业经营分析智能化,构建一套完整的决策智能辅助分析系统。

2022-09-20 09:34:04

数据分析如何重新考虑数据以构建多个网络层

数据分析如何重新考虑数据以构建多个网络层

网络可以是数据聚集的结果,事实上,通过数据分析,我们可以在不同工作时间、位置或条件下观察到相互促进作用。因此,强烈建议数据分析您现在放置不同的数据层、时间、空间、类型。记住并考虑由多个层构成的网络,与多层网络进行数据分析可以提供深入了解聚合网络更新进行比较

2022-11-21 15:55:29

大数据如何结合和利用IT工具进行分析

大数据如何结合和利用IT工具进行分析

大数据的概念应用到由IT操作的工具生成的数据,大数据,使IT管理软件供应商,以解决各类重大的业务决策。大数据非结构化或结构化数据代表了“所有用户的行为、服务水平、安全性、风险、欺诈等”的绝对记录;IT系统、应用和技术发展基础教育设施每天每秒都在产生影响数据

2022-11-22 10:06:21

关于网络流量分析的那些你不知道的事

关于网络流量分析的那些你不知道的事

科技是一直向前发展的,这就少不了创新精神,网络流量分析就是科技创新下的产物,不得不说,有创新精神的人不仅能聚集财富,还能建立职业,适应社会,甚至获得不菲的成就,当然,有更好的输入,才有更好的输出,下面,我就介绍一下传说中的主流网络流量分析是什么,

2020-04-29 16:59:40

数据分析成果产生应用价值的关键方法是什么

数据分析成果产生应用价值的关键方法是什么

目前,业界谈论企业的数据分析研究方法和成果时,往往关心企业信息技术发展能力。关心分析项目管理是否坚持“问题导向、基层导向、客户导向、价值导向”,具体的数据分析建模教学方法的多,是否能解决我国企业自身实际生活问题的少。

2022-11-21 15:55:38

严选云产品

企迈科技轻快餐行业门店经营解决方案 企迈科技轻快餐行业门店经营解决方案,覆盖全生命周期的营销工具,助力快餐品牌打造全生态营销玩法。实现品牌&门店&用户之间的高效闭环运营,抖音公域引流私域,实现全链路闭环。以多渠道小程序服务为切入点,拓展线上线下获客、触达、营销和交易能力,提升会员粘性和促进转化。
摩尔元数MC制造核心平台 MC制造核心平台( MC :Manufacturing Core)采用面向构件技术实现企业级应用快速开发、运行、管理、监控、维护 的开源平台。
数影星球SaaS三方平台帐号管理方案 数影星球SaaS三方平台帐号管理方案,通过数影办公平台访问自有或者第三方办公系统,自动实现数据和行为全管控,安全办公。支持主流电商客户端账号管理,其它三方应用需要定制开发。免开发,不支持标准化账号协议也可接入。精准控制敏感数据流向,保证敏感数据只在受信任的系统之间流转。
声网Agora远程控制工具 声网Agora远程控制工具,随时随地,提供跨平台、跨设备、安全快捷的远程访问,远程支持和远程管理。
智领云BDOS应用云平台 基于 Mesos + Docker 的微服务应用运行平台,支持私有云/公有云/混合云,标准化运维,高效稳定,提高资源利用率
销帮帮日用品制造业CRM解决方案 销帮帮日用品制造业CRM解决方案,搜客让客户查找更高效,获客更精准。线索分类分层管理,显著加速线索流转速度,客户分层分类管理,高效跟进。目标完成度随时查看,高效预测业绩结果。

甄选10000+数字化产品 为您免费使用

申请试用