芯盾时代VAI-视界·可视化人工智能中台_人工智能应用门槛

芯盾时代VAI-视界·可视化人工智能中台

芯盾时代可视化人工智能中台 Visual AI Platform（VAI）致力于为客户打造“一站式”机器学习服务平台，集数据读取、数据预处理、特征工程、模型训练、模型评估、模型部署、模型运行和监控等模型全生命周期管理功能于一体。平台采用可视化拖拉拽的交互设计，支持主流机器学习算法，大幅度降低AI 应用门槛。同时，依托于芯盾时代深耕安全行业积累的实践经验，平台内置数十种风控场景化模型，帮助客户快速实现冷启动，有效降低风控成本，提升时效性、准确率和覆盖率。

立即咨询

AI中台解决的痛点：通用AI能力平台化，提升协作效率，降低人员要求 icon

AI中台实现可模型构建过程的复用

对接数据平台

数据中台或其他基础数据服务对接，迅速接入标准化数据，乃至预处理数据。

多层次可复用

研发流程拆分，对于数据、算法、模型的标准化研发指导，提供可复用服务封装能力。

服务统一化

统一的服务接口规范，支持服务的动态编排组合。

流程角色优化

清晰的研发角色定义，支持任务并行与角色协作，构建AI产品研发流水线，降低人员要求。

视界·AI中台架构：采用从平台到中台演进的策略，四大平台构建AI中台 icon

致力于为金融客户打造“一站式”机器学习服务平台，集数据读取、数据预处理、特征工程、模型训练、模型评估、模型部署、模型运行和监控等模型全生命周期管理功能于一体。

视界·AI中台：总体运转流程 icon

视界·AI中台功能介绍：数据处理平台 icon

数据处理平台主要功能

支持多种数据源对接方式

数据仓库负责存储数据源，支持通过添加本地文件、添加HDFS源和添加数据库等方式对接数据源。同时可对已添加的数据源进行一键预览。

强大的数据理解力

采用新颖的对话框交互方式的进行数据探索；内置丰富的统计分析方法，如：条件统计，协方差矩阵、相关系数矩阵、离散型字段频次统计、连续性字段描述性统计、缺失值统计等，同时亦可支持用户自定义统计分析方法。

视界·AI中台功能介绍：离线建模平台 icon

离线建模平台主要功能

封装丰富的算法，支持定制化和扩展

支持数据预处理（如条件筛选、one-hot编码、stringindex编码、PCA降维等）、特征工程（如分组统计、连续值分桶、字段截取、min-max归一化等）、有监督（LR、FM、RF、SVM、Xgboost、PageRank等）、无监督（自研盗转盗刷挖掘算法、自研无监督团伙挖掘算法、自研无监督反洗钱算法）等算子60+；同时支持定制化开发和扩展

可视化拖拉拽建模方式

基于画布拖动建模组件、输入数据即可自动完成建模的全流程，无基础的 AI 初学者也可毫无障碍的完成整个训练流程，幅提升 AI 工程师效率。

视界·AI中台功能介绍：在线预测平台 icon

在线预测平台主要功能轻松的向生产环境迁移在线预测平台接收“离线建模平台”已完成训练的模型，提供流式特征计算和在线预测服务，完成对模型服务进行部署、测试和发布（如果是对已有的服务更新，则先通过模型更新机制对现有模型进行合理启停更新操作之后再部署发布测试。）轻松实现将“离线建模平台”训练出的模型向生产环境迁移。

视界·AI中台功能介绍：运营监控平台 icon

监控中心功能示例：将筛选出来疑似欺诈账号对应的指标值（如账号1天内关联的IP数）与所有账号的指标均值进行对比，来辅助业务专家进行判断。

运营监控平台主要功能 icon

模型运行效果在线监控

模型服务上线之后，提供可视化统计报表和图表，如全局画像、关键用户画像和关联图谱等，便于运营人员对模型效果进行监控和分析。一旦发现效果跟预期有差异，可回到“离线建模平台”，对模型进行重新训练。

完善的运维体系

提供权限管理，性能监控等运维监控功能，帮助用户排查和定位问题。

视界·AI中台：演示 icon

视界·AI中台：客户价值总结—大幅度降低AI应用的门槛 icon

自建模型方式

每种框架(Tensorflow、PyTorch)都需重复繁琐的步骤，从头到尾搭建。每种算法都需要重复写代码。通过大量样本数据集，不断设置参数进行调优，产生大量模型，记录每次训练结果。模型训练和模型使用脱节，选取最优模型，使用模型都需要手动开发。

视界建模方式

内置众多主流框架，开箱即用。内置主流算法，开箱即用。拖拉拽式模型训练，可视化参数配置，批量可视化评估模型结果。模型训练与预测无缝对接，平台可以帮助用户搭建数据闭环。

视界·AI中台：主要优势总结 icon

预置丰富的金融风控模型

积累了丰富的场景化模型，覆盖大规模撞库盗号、批量开户、盗转盗刷、洗钱、组团骗贷和薅羊毛等风险场景。

简单易用的操作体验

平台采用可视化拖拉拽的交互设计，组件具象化，支持主流机器学习算法，大幅度降低AI应用门槛。

丰富的机器学习算法组件

平台封装了主流的有监督学习、无监督学习、半监督学习算法。同时亦支持自定义算子。

轻松向生产环境迁移

通过在线预测服务引擎，可轻松将平台训练的模型向生产环境迁移，且便于运营、升级与维护。

AI模型在金融行业落地面临的三大问题 icon

黑名单：针对个人，且无法识别新欺诈用户。规则引擎：针对个人，且无法识别新欺诈模式。有监督机器学习：针对个人和团伙，可发现新欺诈模式，但面临冷启动期无标签化数据的窘境。各类策略组合使用效果最优，解决冷启动期样本问题成为关键。金融反欺诈领域中，正负样本比例1:1000~1:10000，甚至在特殊场景下比例可以达到1:100000。独立的机器学习模型无法实现最佳预测效果，将多个独立学习器的结果求平均，在统计、计算效率、性能表现上都有较好的效果。统计上：假设空间h的平均更接近真实值假设f。计算上：迭代求解很可能找到局部最优解，多个局部最优解的平均更接近全局最优解。表现上：真实假设f可能不在已知的假设空间H内，平均可能更接近H外的真实假设f。

冷启动阶段缺少标注样本

有监督机器学习是目前机器学习在反欺诈领域中较为成熟的方法，但面临冷启动期无标签化数据的窘境。

黑白样本严重不均衡

负样本数量差距悬殊的背景下，套用传统机器学习建模思路，是极为不适合的。

如何取得最佳预测效果

独立的机器学习模型无法实现最佳预测效果，如何融合多个不同的模型，实现最佳预测效果？

“冷启动阶段缺少标注样本”解决方案：自研层次化无监督算法 icon

“黑白样本严重不均衡”解决方案：半监督机器学习算法 icon

自编解码网络

多层对称结构的神经网络，充分利用无标注数据，将原始特征映射到低维的空间中去，最大限度提升模型性能。

有标签数据部分

确保预测值与真实值差异最小。

无标签数据部分

确保相似度越大的数据之间预测差异最小。即尽可能将相似度大的数据预测成同一类标签。

“如何取得最佳预测效果”解决方案：多模型融合算法 icon

个体学习器准确性越高、多样性越大，则融合越好。结合实际场景灵活使用无监督模型融合策略、有监督模型融合策略或无监督与有监督模型融合策略，使模型最终效果达到最优。常用的有监督分类器算法包括FM、LR、SVM、XGBOOST等机器学习算法和深度学习算法DBN、CNN等。

模型演进方法论归纳：无监督->半监督->多模型融合 icon

启发式无监督学习

通过多维度无监督学习检测出的多种预制模式下的黑产团伙行为，作为整个AI智能反欺诈系统的冷启动阶段模型。

自适应样本筛选机制

根据前一阶段无监督算法的识别结果，结合部分专家知识经验将所有数据集中部分样本抽取出来供业务专家进行评分处理。相对于全量数据来说，不仅仅大大节省了人工标注样本的时间，同时还能最大限度的为下一阶段积累有价值的黑产数据。

半监督机器学习算法

针对反欺诈领域黑白样本不均衡问题，充分利用前一阶段的少量有标注样本和海量的无标注样本。构造基于多目标函数的auto-encoder架构，最大限度的利用全量数据，提升模型的识别效果。

多模型融合算法

随着时间进一步推移，有标注数据的量在不断积累，当积累到一定程度之后，整个系统会使用多种算法融合的策略，包含：无监督模型融合策略、有监督模型融合策略、无监督与有监督模型融合策略，结合实际场景灵活运用，使模型最终效果达到最优。

案例解析：应用场景

交易风控场景

批量注册检测模型，防薅羊毛模型，大规模撞库盗号检测模型，反洗钱模型，防信用卡套现模型。

信贷风控场景

防组团骗贷模型，申请评分卡模型（A卡），行为评分卡模型（B卡），催收评分卡模型（C卡）。

精准营销场景

理财产品智能推荐模型，高端客户流失预警模型。

案例解析【1】：欺诈团伙识别模型 icon

某城商行项目，客户提供约500W历史业务数据，包含用户进件环节相关数据：姓名、身份证、手机号、IP、时间、位置、家庭住址、公司名称、公司地址、联系人等信息。识别出8个疑似欺诈团伙，涉及设备数100+，涉及账号数1500+。

欺诈团伙特征总结

重复利用有限的设备、IP和身份包装资料由于设备、IP和身份包装资料的成本比较高，欺诈团伙会重复利用这些资源到不同平台反复作案

设备环境存在明显的欺诈特征为了绕过反欺诈系统监控，欺诈者往往需将设备进行Root/越狱获得最高权限后，在设备上安装一些作弊软件，甚至直接采用模拟器来仿冒真实设备

复杂的关联关系欺诈者团伙的设备、账号、IP、身份资料等均是重复利用的，久而久之这些信息之间会存在千丝万缕地联系

批量机器自动化操作行为为提升效率，欺诈团伙往往会采用机器进行自动化批量攻击，时间间隔、频次通正常用户均会有较大差异

案例解析【2】：电子银行反洗钱模型 icon

案例解析【3】：防信用卡套现模型 icon

某城商行客户信用卡套现数据标注项目，客户提供了包含四个行业的商户真实交易数据（脱敏），总共约1000W条，涉及商户4W+，用户300W+。覆盖商户编号、用户表示、交易日期、交易渠道、交易金额、设备编号等信息。通过对用户、商户双维度画像和关联分析，标记出套现样本数据8000+条，最终经过行内专家人工审核，正样本准确率达98%。

信用卡套现特征总结

商户角度

仅有少量商户提供套现，且提供套现的商户很少只提供一次

用户角度

仅有少量用户会套现，且套现的用户很少只套现一次

行业角度

套现黑产交易行为与同行业有显著差异

数据角度

交易行为存在显著行为特征，如消费金额非常整齐，而且相似；非营业时间消费；同卡同商户同金额交易；短时间内同一用户再同一商家连续消费

产品推荐

中安威士数据库透明加密系统

中安威士数据库透明加密系统(简称VS-EC)，基于加密算法和合理的密钥管理，有选择性地加密敏感字段内容，保证存储介质被窃取或文件被非法复制的情况下，数据仍是安全的。

免费试用

查看详情

优鲜信红石榴物管平台

优鲜信红石榴物管平台作为专业智慧物业管理系统，它集成物业人事管理软件，合理调配人力；融合物业财务管理系统，精准把控收支。从日常巡检、设备维护到费用收缴、员工管理，全方位智能化，提升物业运营效率，为业主打造优质居住体验。

免费试用

查看详情

威努特网络流量安全分析系统

威努特网络流量安全分析系统，旁路部署在互联网出口、网络核心等需要监控的网络关键位置，对关键节点进行流量数据采集和全量留存、对安全设备流量复核完成威胁攻击的溯源取证、并提供链路黑管可视化的全链路监控能力和网络性能管理的故障分析定位能力，是一款针对企业级网络的流量与业务的分析、排障、取证运维工具。

免费试用

查看详情

万户软件Flex机关党建系统

万户软件Flex机关党建系统采用领先的平台性设计结构，采用模块化、多层式、分布式系统结构，采用中间件+数据库的方式，开发并支持多种内、外部接口，在系统的稳定性，开放性、扩容性和运行性能方面具备显著优势。采用最新的流程引擎和自定义平台，通过表单自定义，可以根据要求设计对应表单，通过流程配置，可以灵活设置流程节点的相关属性，完全做到自定义配置，以符合各种个性化需求。采用协同办公平台的操作方式，做到统一风格、统一操作，易用性体现在产品设计的每一个细节，在易用性设计方面的指导思想是让用户少记东西、少操作、简洁、容易理解。

免费试用

查看详情