SAS可视化建模统计工具的特性

来源: 云巴巴 2019-10-28 16:38:29

探索性建模(可通过SAS可视化分析探索获得)

  • 在大型数据集中,快速解读复杂联系以及重要变量对预测建模产出的影响。

  • 了解单个变量对模型整体提升度的影响。

  • 侦测异常值和/或影响因子,让您可以在后续分析中判别、捕获和删除它们。

  • 图形化的数据探索,包括条形图、柱状图、箱图、热力图、气泡图、地图和更多图形(使用SAS可视化分析探索)。

  • 根据相关矩阵、散点图和热力图和箱图直接派生出新的模型。

  • 得到预测输出或细分结果,可直接应用到其它建模或可视化任务中。得到的输出可以存储和传送给缺少建模能力的用户使用。

  • 生成模型评分代码。如果某个模型包含从其它模型(如叶节点、聚类节点等)产生的输出,将自动连接起来生成评分代码。

交互式的描述性建模和预测建模技术

  • 过滤观测。

  • 交互式去除异常值,模型自动重新拟合。

  • 用户自定义的事件水平。

模型自动更新,包括如下建模技术:

  • 聚类

    • k-均值聚类。

    • 用于评估聚类成员关系的轮廓图。

    • 输入变量的散点图,用于反映小数据集的聚类特征;以及反映大数据集的聚类特征交叠的热力图。

    • 可以出处聚类群组变量,用于进一步分析。

    • 详细的汇总统计(各聚类的均值、每个聚类的观测个数等等)。

    • 生成按需聚类节点作为一个新的列。

  • 分类树

    • 基于C4.5算法(信息增益或信息增益比率)。

    • 树的交互式生长或修剪。

    • 设置树的深度、最大分支数、叶子大小、修剪的强度等等。

    • 对变量进行分箱处理,可自行决定分箱个数。

    • 可通过为树图或概览图来交互式地探索树的结构。

    • 生成按需聚类节点作为一个新的列。

  • 广义线性模型

    • 支持各种统计分布,包括beta、normal、binary、exponential、gamma、geometric, Poisson, inverse Gaussian 和 negative binomial。

    • 设置收敛和迭代条件。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型汇总、迭代历史、拟合统计、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 逻辑回归

    • 使用logit和probit链接函数来对二值数据进行建模。

    • 影响统计量。

    • 变量选取。

    • 支持偏移变量。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括模型维度、迭代历史、拟合统计、收敛状态、第三类检验、参数估计和相应剖面。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测标签和预测事件可能性并作为新的列。调整预测阈值,以标记某个观测是否为事件。

  • 线性回归

    • 影响统计量。

    • 变量选取。

    • 对变量进行频数和加权处理。

    • 残差诊断。

    • 汇总表包括方差分析、模型维度、拟合统计、模型方差分析、第三类检验和参数估计。

    • 针对预测变量的缺失值处理选项。

    • 按需生成预测值和残差并作为新的列。

  • 分组处理

    • 针对每个群组,构建模型、计算和处理结果,无需每次进行数据排序或建立索引。

    • 在决策树或聚类分析中立即建立基于群组的模型(例如:分层建模)。

  • 模型评估与比较

    • 生成模型比较汇总信息,例如提升图、ROC图、一致性统计和误分类率等评价指标。

    • 交互式地滑动调整预测阈值,用于自动化更新评估统计和误分类率指标。

    • 针对不同分位数,交互式评估提升度。

  • 模型评分

    • 将模型导出为SAS数据步代码,从而与其它应用进行整合。如果某个模型包含从其它模型得出的输出,将自动连结评分代码。

高扩展性内存处理

  • 内存分析引擎SAS LASR分析服务器 (the SAS® LASR Analytic Server) 提供了一个安全、可扩展的多用户环境。

  • 只需一次将数据读入内存,就可以持续支持多用户的实时交互处理无需将数据写入磁盘,也无需在不同分析步骤中对数据重排。

  • 支持单服务器模式(适用于小的部门团队),也支持分布式环境,从而支持多节点多线程的高性能处理。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

关于数据分析5大软件大之R软件

关于数据分析5大软件大之R软件

在上篇文章中,小编讲了数据分析5大软件大的Excel和SAS软件,而本篇文章,就和大家主要讲解一下数据分析的5大软件大之R软件一些基础知识。

2022-11-21 15:51:00

将机器运营数据分析转化为答案

将机器运营数据分析转化为答案

小到个人大到企业,无时不刻环绕于数据之中。个人可以通过分析自己的体重数据等合理指定健康计划,企业也可以将数据融入每个问题、决策和行动之中。借助让人们能够调查、监控、分析和行动的解决方案,释放数据的真正力量。通过移动交互和增强现实等手段,实时向正确的人提供可

2021-12-03 11:53:42

有关于日志收集与分析与日志基础概念

有关于日志收集与分析与日志基础概念

日志收集与分析作为现代的技术革新给我们带来了很多便利,它们的存在,同时也对于传统文化的产生了巨大的影响。所以,我们要善于运用这些新科技,善于利用日志收集与分析。 日志是状态与状态之间的变化量。日志相比状态最大的好处是,能够记录整个细节。例如10点0,

2020-05-06 18:04:22

大数据平台从平台搭建到数据分析步骤

大数据平台从平台搭建到数据分析步骤

我们来聊聊大数据平台从平台搭建到数据分析步骤的问题。     一般的大数据平台的搭建对平台包括以下步骤中的数据的技术分析:     1、Linux系统安装     一般可以使用一个开源版的Redhat系统--CentOS作为社会底层技术平台。

2020-05-07 17:18:17

如何去分析和规划自身企业信息化建设的需求

如何去分析和规划自身企业信息化建设的需求

我们脚下的土地无时不刻发生着翻天覆地的变化,这一切都源于科技,说到科技,就不得不说一下什么是企业信息化了。 在选择信息软件之前,企业必须首先明确自己的需求,也就是企业实现信息化要解决什么问题,当前,很多企业还是处在传统的手工管理模式,还处在由计划经济向市

2022-11-21 11:29:23

利用用户行为分析建立用户偏好模型

利用用户行为分析建立用户偏好模型

了解用户行为分析系统,做到精准获客,实现利益最大化,还在等什么,你值得拥有这个知识,去达到你想拥有的财富,赶快往下看吧! 我们采用矩阵运算的思维方式,以图书阅读为例说明。那么用户的行为矩阵可以表达为:,表示图书,行表示用户我们暂只考虑图书的购买行为,0表

2022-11-21 11:07:57

严选云产品

北极星OKR数字化目标管理工具 北极星OKR数字化目标管理工具,上下目标一致,聚焦重点项目,保证垂直方向和水平方向的高度对齐。团队成员之间,团队与团队之间基于共同目标彼此协同,实现1+1大于2的化学效应。更大程度地释放员工个人内在工作热情,愿意发自内心地付出更多超越职责的努力。
环信医疗⾏业IM即时通讯解决⽅案 环信医疗⾏业IM即时通讯解决⽅案,提供PaaS的IM⽅案和SaaS的全渠道客服⽅案,满⾜客户的多种选择。具备客户端加密、服务端加密、传输过程加密和⽤户信息保护多重安全保障,确保信息安全。实现医疗资源的充分利用,医疗效率的提高,满足病患医治、企业效益、社会效益的多重需求。
联软科技金融行业软件管理解决方案 联软科技金融行业软件管理解决方案云端应用商城,自动同步更,应用软件运行控制,涵盖所有业务场景,存量软件处理,全网终端标准化管理。软仓下载/软件分发,中继减少带宽压力,提升用户体验。绿色软件管理,满足合规要求。
海泰方圆电子公文资源库与数字档案管理 电子文件管理系统能够实现多系统电子文件整合,建立电子文件资源中心,能够为电子公文、电子证照等提供电子文件预归档处理能力,支撑电子文件形成办理、归档利用、长期保存的全生命周期信息化管理。
安科瑞充电桩收费运营解决方案 安科瑞Acrelcloud-9000充电桩收费运营云平台系统集成了汽车充电桩和电瓶车充电桩管理系统,通过物联网技术对接入系统的充电桩站点和各个充电桩进行不间断地数据采集和监控,同时对各类故障如充电机过温保护、充电机输入输出过压、欠压、绝缘检测故障等系―列故障进行预警。
山石网科入侵检测和防御系统 山石网科IDPS的高级威胁检测功能采用基于威胁行为分析的未知威胁检测方法,结合云沙箱服务,能够有效应对日益增加的APT攻击,为客户提供针对已知攻击和未知攻击的全面威胁检测和防御能力。

甄选10000+数字化产品 为您免费使用

申请试用