iconAI中台解决的痛点:通用AI能力平台化,提升协作效率,降低人员要求icon
AI中台实现可模型构建过程的复用
对接数据平台
数据中台或其他基础数据服务对接,迅速接入标准化数据,乃至预处理数据。
多层次可复用
研发流程拆分,对于数据、算法、模型的标准化研发指导,提供可复用服务封装能力。
服务统一化
统一的服务接口规范,支持服务的动态编排组合。
流程角色优化
清晰的研发角色定义,支持任务并行与角色协作,构建AI产品研发流水线,降低人员要求。
icon视界·AI中台架构:采用从平台到中台演进的策略,四大平台构建AI中台icon

致力于为金融客户打造“一站式”机器学习服务平台,集数据读取、数据预处理、特征工程、模型训练、模型评估、模型部署、模型运行和监控等模型全生命周期管理功能于一体。

icon视界·AI中台:总体运转流程icon
icon视界·AI中台功能介绍:数据处理平台icon
数据处理平台主要功能
支持多种数据源对接方式
数据仓库负责存储数据源,支持通过添加本地文件、添加HDFS源和添加数据库等方式对接数据源。同时可对已添加的数据源进行一键预览。
强大的数据理解力
采用新颖的对话框交互方式的进行数据探索;内置丰富的统计分析方法,如:条件统计,协方差矩阵、相关系数矩阵、离散型字段频次统计、连续性字段描述性统计、缺失值统计等,同时亦可支持用户自定义统计分析方法。
icon视界·AI中台功能介绍:离线建模平台icon
离线建模平台主要功能
封装丰富的算法,支持定制化和扩展
支持数据预处理(如条件筛选、one-hot编码、stringindex编码、PCA降维等)、特征工程(如分组统计、连续值分桶、字段截取、min-max归一化等)、 有监督(LR、FM、RF、SVM、Xgboost、PageRank等)、无监督(自研盗转盗刷挖掘算法、自研无监督团伙挖掘算法、自研无监督反洗钱算法)等算子60+;同时支持定制化开发和扩展
可视化拖拉拽建模方式
基于画布拖动建模组件、输入数据即可自动完成建模的全流程,无基础的 AI 初学者也可毫无障碍的完成整个训练流程,幅提升 AI 工程师效率。 
icon视界·AI中台功能介绍:在线预测平台icon

在线预测平台主要功能 轻松的向生产环境迁移 在线预测平台接收“离线建模平台”已完成训练的模型,提供流式特征计算和在线预测服务,完成对模型服务进行部署、测试和发布( 如果是对已有的服务更新,则先通过模型更新机制对现有模型进行合理启停更新操作之后再部署发布测试。)轻松实现将“离线建模平台”训练出的模型向生产环境迁移。

icon视界·AI中台功能介绍:运营监控平台icon

监控中心功能示例:将筛选出来疑似欺诈账号对应的指标值(如账号1天内关联的IP数)与所有账号的指标均值进行对比,来辅助业务专家进行判断。

icon运营监控平台主要功能icon
模型运行效果在线监控
模型服务上线之后,提供可视化统计报表和图表,如全局画像、关键用户画像和关联图谱等,便于运营人员对模型效果进行监控和分析。一旦发现效果跟预期有差异,可回到“离线建模平台”,对模型进行重新训练。
完善的运维体系
提供权限管理,性能监控等运维监控功能,帮助用户排查和定位问题。
icon视界·AI中台:演示icon
icon视界·AI中台:客户价值总结—大幅度降低AI应用的门槛icon
自建模型方式
每种框架(Tensorflow、PyTorch)都需重复繁琐的步骤,从头到尾搭建。 每种算法都需要重复写代码。 通过大量样本数据集,不断设置参数进行调优,产生大量模型,记录每次训练结果。 模型训练和模型使用脱节, 选取最优模型,使用模型都需要手动开发。
视界建模方式
内置众多主流框架,开箱即用。 内置主流算法,开箱即用。 拖拉拽式模型训练,可视化参数配置,批量可视化评估模型结果。 模型训练与预测无缝对接,平台可以帮助用户搭建数据闭环。
icon视界·AI中台:主要优势总结icon
预置丰富的金融风控模型
积累了丰富的场景化模型,覆盖大规模撞库盗号、批量开户、盗转盗刷、洗钱、组团骗贷和薅羊毛等风险场景。
简单易用的操作体验
平台采用可视化拖拉拽的交互设计,组件具象化,支持主流机器学习算法,大幅度降低AI应用门槛。
 
 
丰富的机器学习算法组件
平台封装了主流的有监督学习、无监督学习、半监督学习算法。同时亦支持自定义算子。
轻松向生产环境迁移
通过在线预测服务引擎,可轻松将平台训练的模型向生产环境迁移,且便于运营、升级与维护。
iconAI模型在金融行业落地面临的三大问题icon

黑名单:针对个人,且无法识别新欺诈用户。 规则引擎:针对个人,且无法识别新欺诈模式。 有监督机器学习:针对个人和团伙,可发现新欺诈模式,但面临冷启动期无标签化数据的窘境。 各类策略组合使用效果最优,解决冷启动期样本问题成为关键。 金融反欺诈领域中,正负样本比例1:1000~1:10000,甚至在特殊场景下比例可以达到1:100000。 独立的机器学习模型无法实现最佳预测效果,将多个独立学习器的结果求平均,在统计、计算效率、性能表现上都有较好的效果。 统计上:假设空间h的平均更接近真实值假设f。 计算上:迭代求解很可能找到局部最优解,多个局部最优解的平均更接近全局最优解。 表现上:真实假设f可能不在已知的假设空间H内,平均可能更接近H外的真实假设f。

冷启动阶段缺少标注样本

有监督机器学习是目前机器学习在反欺诈领域中较为成熟的方法,但面临冷启动期无标签化数据的窘境。

黑白样本严重不均衡

负样本数量差距悬殊的背景下,套用传统机器学习建模思路,是极为不适合的。

如何取得最佳预测效果

独立的机器学习模型无法实现最佳预测效果,如何融合多个不同的模型,实现最佳预测效果?

icon“冷启动阶段缺少标注样本”解决方案:自研层次化无监督算法icon
icon“黑白样本严重不均衡”解决方案:半监督机器学习算法icon
自编解码网络

多层对称结构的神经网络,充分利用无标注数据,将原始特征映射到低维的空间中去,最大限度提升模型性能。

有标签数据部分

确保预测值与真实值差异最小。

无标签数据部分

确保相似度越大的数据之间预测差异最小。即尽可能将相似度大的数据预测成同一类标签。

icon“如何取得最佳预测效果”解决方案:多模型融合算法 icon

个体学习器准确性越高、多样性越大,则融合越好。结合实际场景灵活使用无监督模型融合策略、有监督模型融合策略或无监督与有监督模型融合策略,使模型最终效果达到最优。常用的有监督分类器算法包括FM、LR、SVM、XGBOOST等机器学习算法和深度学习算法DBN、CNN等。

icon模型演进方法论归纳:无监督->半监督->多模型融合icon
启发式无监督学习
通过多维度无监督学习检测出的多种预制模式下的黑产团伙行为,作为整个AI智能反欺诈系统的冷启动阶段模型。
 
自适应样本筛选机制
根据前一阶段无监督算法的识别结果,结合部分专家知识经验将所有数据集中部分样本抽取出来供业务专家进行评分处理。相对于全量数据来说,不仅仅大大节省了人工标注样本的时间,同时还能最大限度的为下一阶段积累有价值的黑产数据。
 
 
半监督机器学习算法
针对反欺诈领域黑白样本不均衡问题,充分利用前一阶段的少量有标注样本和海量的无标注样本。构造基于多目标函数的auto-encoder架构,最大限度的利用全量数据,提升模型的识别效果。
多模型融合算法
随着时间进一步推移,有标注数据的量在不断积累,当积累到一定程度之后,整个系统会使用多种算法融合的策略,包含:无监督模型融合策略、有监督模型融合策略、无监督与有监督模型融合策略,结合实际场景灵活运用,使模型最终效果达到最优。
icon案例解析:应用场景icon
交易风控场景

批量注册检测模型, 防薅羊毛模型, 大规模撞库盗号检测模型, 反洗钱模型, 防信用卡套现模型。

信贷风控场景

防组团骗贷模型, 申请评分卡模型(A卡), 行为评分卡模型(B卡), 催收评分卡模型(C卡)。

精准营销场景

理财产品智能推荐模型, 高端客户流失预警模型。

icon案例解析【1】:欺诈团伙识别模型icon

某城商行项目,客户提供约500W历史业务数据,包含用户进件环节相关数据:姓名、身份证、手机号、IP、时间、位置、家庭住址、公司名称、公司地址、联系人等信息。识别出8个疑似欺诈团伙,涉及设备数100+,涉及账号数1500+。

欺诈团伙特征总结
重复利用有限的设备、IP和身份包装资料 由于设备、IP和身份包装资料的成本比较高,欺诈团伙会重复利用这些资源到不同平台反复作案
设备环境存在明显的欺诈特征 为了绕过反欺诈系统监控,欺诈者往往需将设备进行Root/越狱获得最高权限后,在设备上安装一些作弊软件,甚至直接采用模拟器来仿冒真实设备
复杂的关联关系 欺诈者团伙的设备、账号、IP、身份资料等均是重复利用的,久而久之这些信息之间会存在千丝万缕地联系
批量机器自动化操作行为 为提升效率,欺诈团伙往往会采用机器进行自动化批量攻击,时间间隔、频次通正常用户均会有较大差异
icon案例解析【2】:电子银行反洗钱模型icon
icon案例解析【3】:防信用卡套现模型icon

某城商行客户信用卡套现数据标注项目,客户提供了包含四个行业的商户真实交易数据(脱敏),总共约1000W条,涉及商户4W+,用户300W+。覆盖商户编号、用户表示、交易日期、交易渠道、交易金额、设备编号等信息。通过对用户、商户双维度画像和关联分析,标记出套现样本数据8000+条,最终经过行内专家人工审核,正样本准确率达98%。

信用卡套现特征总结
商户角度
仅有少量商户提供套现,且提供套现的商户很少只提供一次
用户角度
仅有少量用户会套现,且套现的用户很少只套现一次
行业角度
套现黑产交易行为与同行业有显著差异
数据角度
交易行为存在显著行为特征,如消费金额非常整齐,而且相似;非营业时间消费;同卡同商户同金额交易;短时间内同一用户再同一商家连续消费
产品推荐 查看更多>>
    智能人脸识别摄像机

    一款集人脸检测、采集、比对等功能于一体的人脸识别专用摄像机,无需配套服务器即可独立运行,后台可实现管理审核控制功能,可自动注册、微信注册人脸模板,照片大小仅为30K左右,已完成人脸识别算法授权,广泛适用于各类1:N人脸比对应用场景。

    功能完备

    应用广泛

    信译-信息机器翻译

    基于团队近二十年在机器翻译上的技术积累、采用国际最先进的深度学习算法、针对垂直领域的精准训练,为用户提供最优质的机器翻译结果。

    高效稳定

    高可用

    朗迪锋SoErgo人机工程仿真分析工具SoErgo

    SoErgo是国内第一款专注于人机工程行业应用的仿真分析软件,主要针对于航空航天、国防军工、轨道交通等工业制造业及高校、研究所等科研单位 的人机工程仿真分析应用需求。

    高效稳定

    功能完备