
RAG、Agent、DP或文档相关任务落地常见问题
我们的针对性方案
加速器一:通用文档解析-Parsex

加速器二:智能文档抽取-OpenKIE
测试集场景:覆盖银行、保险、制造、能源、零售等47个场景,共3200+类文档,开箱即用

加速器三:文本向量Embedding
acge_text_embedding获Massive Text Embedding Benchmark (MTEB)中文榜单(C-MTEB)第一名的成绩

加速器四:图像处理(切边、增强、压缩)
图像切边增强产品,可以自动识别将图像中的重要内容,将其切出,并校正回矩形。该产品不仅能处理拍摄视角带来的畸变,也能处理旋转、曲面图带来的畸变。

产品流程

关键技术

速度效果

测评指标
元素对象、页面、数据集3个层级

测评情况

能力展示:双栏

能力展示:非对称双栏

能力展示:多栏表格

能力展示:目录层级

应用效果:更高的文档问答精度

应用效果:参考内容定位与高亮

输出形式:markdown

输出形式:json

场景一:知识库(RAG)

场景二:智能文档抽取( OpenKIE)

场景三:大模型预训练语料与数据治理快速入库



