1、面向精准合规的要求,从企业级知识库准确找到答案,帮助模型准确生成结果;
2、从搜索引擎中学习现有知识,帮助模型了解实时讯息。
通过大模型技术构建智能客服的交互大脑,无需配置对话流程,让智能客服自主实现对话流程控制、异常流程交互引导,并自动调用API,更好地完成多轮复杂业务。
十亿级数据规模、万级QPS检索、检索平均延迟毫秒级别高可用、可扩展。
痛点:复杂的图文混排文档,常常包含无明显边界的组合图形,且易重叠、错位,错误解析结果,将极大影响模型阅读理解的准确率。
能力优势:
① 结合OCR大模型技术,将复杂文档图片表格转换成可编辑的markdown文本,支持版面元素内容识别、分割(图、表、公式、标题、页眉和页
4脚等7种版面元素类型)
② 图文输出:构建图、文、表混排文档的高质量训练数据,优化prompt设计,提升汽车、零售、等说明书场景下的出图率, 生成图文并茂的答案。
结合模型推理能力和向量数据库的存储和检索能力, 让模型结合相关片段上下文理解, 有效解决“张冠李戴”等事实类问题。
· 采用表格序列化技术,将表格转写成信息量丰富的文本片段,可复用段落检索模型情况下,大幅提升表格检索准确率。
· 表格阅读理解层面,利用COT等技术,让模型一步步推导结果,提升模型对表格元素推理、比较的能力 ,同时提升对表格元素的检索准确率。
通过向量数据库支持标签检索,满足向量+条件过滤组合查询。
针对不同身份的用户,咨询同一问题, 根据用户输入信息及进线标签,准确判断用户意图标签,并基于文档适用范围给出对应答案。