人工智能三大件:算法、算力、数据。
这个顶层的数字“新基建”设计下,真正做好人工智能,尤其是做好一个NLP智能交互系统,为企业服务、营销和分析决策所用,充满诸多挑战。这是算法、工程、研发、产品、交付的“大合唱”,是技术与行业“术”与“道”的“大融合”,是用户体验与企业价值的“大考问”。
在这个过程中,算法提供怎样的硬核动力,不断进化创新?算法与业务如何相互驱动,助力客户?追一的算法团队,又如何自驱创新,穿越“大小年”的技术周期,始终保持行业领先?
本期访谈嘉宾,追一科技AI Lab高级研究员Nick,这个曾经为我们分享过BERT等进展的技术男神,分享过去4年,团队在算法研究的成长故事,Let’s Go。
▲ 追一科技AI Lab高级研究员Nick
“网吧”里的深度学习
2016年秋的某一天,Nick加入追一的时候,感觉像“走进了一家网吧”。
当时,外面很多关于AI和深度学习的认知,都是殿堂味的:论文、榜单、顶会、各种阿尔法“狗狗”人机大战,但深圳科技园里的追一,已经在企业级市场,投身AI落地应用。
▲ 2016年夏的追一科技团队
“两间小屋子,大家都坐在电脑前,个个很年轻,挨得紧紧的”,产品、工程、架构设计、交付…二三十人,挤在一起,像在网吧里工作。Nick就这样成为了公司最早一批算法工程师,没有复杂的流程,没有什么仪式感,第一件事,就是马上上手熟悉代码,继而提出优化想法。
大家正在用新的方法,做企业服务机器人,而机器人,当时流行的还是关键词和句法模板,运营模式日趋臃肿,智能化水平也遭遇天花板。一些对技术敏锐和勇于创新的公司,比如互联网的滴滴、携程,随后金融行业的招商银行,开始选择和追一合作,用深度学习技术,升级新一代机器人。
Nick很快接到了前方的需求。入职没多久,时任算法负责人的杨老师拿来一份代码,“Nick,这个模型你看下能不能修改一下,就要上线。”这是一个意图理解模型,识别和处理各种会话,场景是智能客服。很快Nick就改好了一版,交出去,“当时,模型还是比较简单的”,他谦虚地说。
这也是追一最早、最“古老”的意图理解模型,当时的客户,只有少量几个。
从文本到多模态能力
但随后AI的发展,如雨后春笋。
2017年春节前后,Nick和同事们完成了全新的模型改动上线。前方也在努力打单,更多的客户陆续接入。虽然面向的是企业级市场,但追一却拿出了“互联网”的节奏感,Nick介绍说,核心的意图模型,以平均每年一次大型迭代,十几次的更新节奏,快速进化。“当年的老模型,除了一些文件夹和层级结构,代码已经完全重构了。”
在这个庞大的系统中,产品像是建筑设计,负责功能和外观设计;后台工程像是土木工程,负责力学结构,让AI平稳牢固;算法提供基础组件,用在不同的系统模块中,实现不同的功能。
Nick说,每一次的更新都是里程式的,但更重要的是,越来越多的算法技术分支,伴随客户和业务需求,生长壮大。
▲ 2019年,追一举办首届中文NL2SQL挑战赛
时至今日,追一科技已经形成文本智能、语音智能、视觉多模态等核心AI能力,一些核心的能力,甚至达到了国际水平。2019年,在NLP的新基准测试SuperGLUE中,追一科技全球排名第二,工业模型排名第一,超过Facebook,并且,评测模型的工业化应用能力已经很高,已经落地到追一科技的AI数字员工产品线上。
4年来,落地应用的场景,也从互联网向金融、能源、汽车、地产、政务、教育等领域不断扩展,应用功能也越来越多,多轮对话、任务驱动会话、知识驱动对话、结构化查询、智能分析、情感识别、多模态交互…..
AI发展的节奏,甚至会让参与其中的人,都始料未及。但商业和技术双轮驱动,逐渐成为大家共识。
双轮驱动
“在追一科技,业务牵引和技术驱动同样重要,两条腿一起走” ,Nick表示,追一科技会定期与企业用户进行深入的交流,了解他们在实际业务中的需求和遇到的困难,然后将这些需求和困难抽象成一个个的技术问题,进行攻坚。在解决这些技术问题的过程中,也就孵化出满足某些业务、某些场景需求的产品或者解决方案,进而赋能有同样需求的企业。
▲ 追一科技在WOT全球人工智能技术峰会分享实践成果
和通常的理解不同,他认为AI整体其实是重应用的。即便是学界有一些关于纯理论研究,很多时候也是应用导向,冲着某个问题去的,只是学界研究问题抽象程度更高,场景更单纯而已。这门技术其实很看重“面向钉子设计锤子”,因此是先有问题,再有解决方案。算法也会在业务投入和研究上,进行“动态平衡。”
贴近业务,能够让算法更好地落地,算法研发也更有参与感和成就感。
Nick举了个例子,有一年公司去某家运营商POC,与友商PK,当时大家就把最新优化的模型拿去跑了一下,也没做临时的修改,就比对方效果好出很多,其实对方的技术也不差,但追一一下子就跑到90%的准确率。
“从纯模型角度上看,很难在短期内把它从80提到90%”,Nick说,算法功夫在平时,需要持续的迭代模型,“日常的时候,感觉会不明显,但到了战场,我们会取得胜利。”
自驱力,算法的欲望
IT技术的更新很快,AI算法更是“快中之快”。
但要捕捉到前沿,保持领先的优势,没有办法临时突击,更多的功夫在平时积累,对算法保持“兴奋”和“欲望”。每天都可能有上百篇新的论文、新的方法扑面而来,其中,可能有很多有价值的地方可以激发新的想法;也可能充满了噪音;也可能,是一个未知的方向,这个未知的方向,在努力很久之后,却戛然而止。
“不是真的热爱这个东西,很难长时间坚持跟进的。” Nick说。
算法研究虽然有部分是确定的,但也很有多探索的成分,就像做实验一样,失败的总是比成功的多,就像爱迪生发明灯泡一样,“你试了1000种,最终可能只成功一种”。如何去提高这种成功率,也是对自身算法技术的考验,在不确定性中前进已成为追一算法同学的独特气质。而保证技术领先性则一方面是靠对技术趋势的预判,做好布局;另一方面是靠自驱力,对技术不断保持探索的欲望。
● 关于追一
追一科技是领先的人工智能公司和AI数字员工提供商,主攻深度学习和自然语言处理,提供智能语义、语音和视觉的AI全栈服务。通过将AI数字员工智能平台与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、办公等多种场景的智能化升级需求,帮助他们降本提效,改善用户体验,驱动创新和增长。
2016年成立以来,追一科技深度服务国内300多家头部客户与合作伙伴,包括招商银行信用卡、浦发银行信用卡、中国移动、南方电网、中国石油、腾讯、万达集团等众多领军企业,打造出AI商业化应用标杆和多个行业的智能化解决方案。
依托AI产品技术的深厚积累、对行业需求的洞察理解、端到端的AI服务能力、成熟的生态合作体系,追一科技为金融、互联网、地产、零售、汽车、政企、能源、运营商等多领域客户提供通用型和行业型数字员工,释放超过30亿元价值人力成本,加速企业智能化升级。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-22 16:06:37
2022-11-21 10:12:24
2022-11-24 10:44:15
2020-04-20 18:03:31
2022-11-24 10:13:24
2022-11-24 11:21:04
甄选10000+数字化产品 为您免费使用
申请试用
评论列表