立即咨询

电话咨询

微信咨询

立即试用
商务合作

4年了,这段意图模型代码变成这样…

2022-11-21

人工智能三大件:算法算力数据

这个顶层的数字“新基建”设计下,真正做好人工智能,尤其是做好一个NLP智能交互系统,为企业服务、营销和分析决策所用,充满诸多挑战。这是算法、工程、研发、产品、交付的“大合唱”,是技术与行业“术”与“道”的“大融合”,是用户体验与企业价值的“大考问”。

在这个过程中,算法提供怎样的硬核动力,不断进化创新?算法与业务如何相互驱动,助力客户?追一的算法团队,又如何自驱创新,穿越“大小年”的技术周期,始终保持行业领先?

本期访谈嘉宾,追一科技AI Lab高级研究员Nick,这个曾经为我们分享过BERT等进展的技术男神,分享过去4年,团队在算法研究的成长故事,Let’s Go。

▲ 追一科技AI Lab高级研究员Nick

“网吧”里的深度学习

2016年秋的某一天,Nick加入追一的时候,感觉像“走进了一家网吧”。

当时,外面很多关于AI和深度学习的认知,都是殿堂味的:论文、榜单、顶会、各种阿尔法“狗狗”人机大战,但深圳科技园里的追一,已经在企业级市场,投身AI落地应用。

▲ 2016年夏的追一科技团队

“两间小屋子,大家都坐在电脑前,个个很年轻,挨得紧紧的”,产品、工程、架构设计、交付…二三十人,挤在一起,像在网吧里工作。Nick就这样成为了公司最早一批算法工程师,没有复杂的流程,没有什么仪式感,第一件事,就是马上上手熟悉代码,继而提出优化想法。

大家正在用新的方法,做企业服务机器人,而机器人,当时流行的还是关键词和句法模板,运营模式日趋臃肿,智能化水平也遭遇天花板。一些对技术敏锐和勇于创新的公司,比如互联网的滴滴、携程,随后金融行业的招商银行,开始选择和追一合作,用深度学习技术,升级新一代机器人。

Nick很快接到了前方的需求。入职没多久,时任算法负责人的杨老师拿来一份代码,“Nick,这个模型你看下能不能修改一下,就要上线。”这是一个意图理解模型,识别和处理各种会话,场景是智能客服。很快Nick就改好了一版,交出去,“当时,模型还是比较简单的”,他谦虚地说。

这也是追一最早、最“古老”的意图理解模型,当时的客户,只有少量几个。

从文本到多模态能力

但随后AI的发展,如雨后春笋。

2017年春节前后,Nick和同事们完成了全新的模型改动上线。前方也在努力打单,更多的客户陆续接入。虽然面向的是企业级市场,但追一却拿出了“互联网”的节奏感,Nick介绍说,核心的意图模型,以平均每年一次大型迭代,十几次的更新节奏,快速进化。“当年的老模型,除了一些文件夹和层级结构,代码已经完全重构了。”

在这个庞大的系统中,产品像是建筑设计,负责功能和外观设计;后台工程像是土木工程,负责力学结构,让AI平稳牢固;算法提供基础组件,用在不同的系统模块中,实现不同的功能。

Nick说,每一次的更新都是里程式的,但更重要的是,越来越多的算法技术分支,伴随客户和业务需求,生长壮大。

▲ 2019年,追一举办首届中文NL2SQL挑战赛

时至今日,追一科技已经形成文本智能、语音智能、视觉多模态等核心AI能力,一些核心的能力,甚至达到了国际水平。2019年,在NLP的新基准测试SuperGLUE中,追一科技全球排名第二工业模型排名第一,超过Facebook,并且,评测模型的工业化应用能力已经很高,已经落地到追一科技的AI数字员工产品线上。

4年来,落地应用的场景,也从互联网向金融、能源、汽车、地产、政务、教育等领域不断扩展,应用功能也越来越多,多轮对话、任务驱动会话、知识驱动对话、结构化查询、智能分析、情感识别、多模态交互…..

AI发展的节奏,甚至会让参与其中的人,都始料未及。但商业和技术双轮驱动,逐渐成为大家共识。

双轮驱动

“在追一科技,业务牵引和技术驱动同样重要,两条腿一起走” ,Nick表示,追一科技会定期与企业用户进行深入的交流,了解他们在实际业务中的需求和遇到的困难,然后将这些需求和困难抽象成一个个的技术问题,进行攻坚。在解决这些技术问题的过程中,也就孵化出满足某些业务、某些场景需求的产品或者解决方案,进而赋能有同样需求的企业。

▲ 追一科技在WOT全球人工智能技术峰会分享实践成果

和通常的理解不同,他认为AI整体其实是重应用的。即便是学界有一些关于纯理论研究,很多时候也是应用导向,冲着某个问题去的,只是学界研究问题抽象程度更高,场景更单纯而已。这门技术其实很看重“面向钉子设计锤子”,因此是先有问题,再有解决方案。算法也会在业务投入和研究上,进行“动态平衡。”

贴近业务,能够让算法更好地落地,算法研发也更有参与感和成就感。

Nick举了个例子,有一年公司去某家运营商POC,与友商PK,当时大家就把最新优化的模型拿去跑了一下,也没做临时的修改,就比对方效果好出很多,其实对方的技术也不差,但追一一下子就跑到90%的准确率。

“从纯模型角度上看,很难在短期内把它从80提到90%”,Nick说,算法功夫在平时,需要持续的迭代模型,“日常的时候,感觉会不明显,但到了战场,我们会取得胜利。”

自驱力,算法的欲望

IT技术的更新很快,AI算法更是“快中之快”。

但要捕捉到前沿,保持领先的优势,没有办法临时突击,更多的功夫在平时积累,对算法保持“兴奋”和“欲望”。每天都可能有上百篇新的论文、新的方法扑面而来,其中,可能有很多有价值的地方可以激发新的想法;也可能充满了噪音;也可能,是一个未知的方向,这个未知的方向,在努力很久之后,却戛然而止。

“不是真的热爱这个东西,很难长时间坚持跟进的。” Nick说。

算法研究虽然有部分是确定的,但也很有多探索的成分,就像做实验一样,失败的总是比成功的多,就像爱迪生发明灯泡一样,“你试了1000种,最终可能只成功一种”。如何去提高这种成功率,也是对自身算法技术的考验,在不确定性中前进已成为追一算法同学的独特气质。而保证技术领先性则一方面是靠对技术趋势的预判,做好布局;另一方面是靠自驱力,对技术不断保持探索的欲望。

● 关于追一

追一科技是领先的人工智能公司和AI数字员工提供商,主攻深度学习和自然语言处理,提供智能语义、语音和视觉的AI全栈服务。通过将AI数字员工智能平台与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、办公等多种场景的智能化升级需求,帮助他们降本提效,改善用户体验,驱动创新和增长。

2016年成立以来,追一科技深度服务国内300多家头部客户与合作伙伴,包括招商银行信用卡、浦发银行信用卡、中国移动、南方电网、中国石油、腾讯、万达集团等众多领军企业,打造出AI商业化应用标杆和多个行业的智能化解决方案。

依托AI产品技术的深厚积累、对行业需求的洞察理解、端到端的AI服务能力、成熟的生态合作体系,追一科技为金融、互联网、地产、零售、汽车、政企、能源、运营商等多领域客户提供通用型和行业型数字员工,释放超过30亿元价值人力成本,加速企业智能化升级。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

腾讯云即时通信IM腾讯云即时通信IM,覆盖全平台、低门槛快速集成,可与TRTC、云直播、云点播、互动白板等产品协同使用。支持文字、表情、图片、短语音、短视频、文件、位置等多种消息类型,提升用户活跃度 。好友工作群、陌生人社交群、临时会议群、直播群、社群等多种群组类型,满足特定群聊场景,丰富社交手段。
北森coreHR人力资源管理系统北森coreHR人力资源管理系统通过创新的一体化HR SaaS及人才管理平台 —— iTalentX,北森为中国企业提供人力资源管理场景中所有技术和产品,包括HR软件、人才管理技术、员工服务生态、低代码平台的端到端整体解决方案。帮助企业实现覆盖员工招募、入职、管理到离职的全生命周期的数字化管理,快速提升人力资源管理效率、人才管理能力、帮助员工成长,实现智慧决策。
百度智能云曦灵智能数字人平台百度智能云曦灵-智能数字人平台,致力于打造智能的服务型&演艺型数字人,面向金融、媒体,运营商、MCN,互娱等行业,提供全新客户体验及服务。该平台可进一步降低数字人应用门槛,实现人机可视化语音交互服务和内容生产服务,有效提升用户体验、降低人力成本,提升服务质量和效率。
云客工作手机云客工作手机,针对销售全流程业务特性,打造以销售为本,透明化、数字化、一体化行业解决方案,为销售赋能、企业业绩转化提供新的生态体系。
壹悟科技智能物流仿真系统Simulator壹悟科技智能物流仿真系统(Simulator)可以实现对仓储场景和工厂场景的业务流程仿真。支持用户导入项目现场运行地图,自定义移动机器人的参数和数量,以真实的物流业务调度系统(WCS)和机器人调度系统(RCS)为内核,驱动仿真运行,高度还原业务实际场景的作业流程和节拍。支持2D和3D实时运行显示,并提供完善的运行数据统计分析。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
中小企业数据库选型必看!从成本、安全到资质,核心维度对比

中小企业的数据库选型攻略!腾讯云数据库不同场景怎么选?一文说清核心优势!

2025-06-04
劳动风险防控AI工具盘点:腾讯电子签的3大核心优势解析

企业人力资源合规工具选型指南!腾讯电子签如何用AI实现劳动风险防控?

2025-06-04
从API到智能体开发,腾讯云DeepSeek-R1-0528上线,选它到底强在哪?

腾讯云率先上线了DeepSeek-R1-0528版本API接口,标志着国产大模型在企业级应用领域迈入新阶段。在AI开发平台选择日益复杂的当下,企业不仅需要强大的底层模型,更需兼顾开发效率、业务适配性和安全可控性。

2025-06-03
超全的外贸软件深度选型指南,南北外贸把客户开发、邮件营销、海外商情全搞定!

从客户开发、商机挖掘到订单执行,每一个环节的数字化能力都直接影响企业的生存空间。如何选择一套覆盖全链路的外贸管理系统呢?

2025-06-03
查看更多