电话咨询
微信咨询
紫东太初是中科院自动化所推出的多模态大模型,支持文本、图像、语音跨模态理解与生成,面向科研验证与产业应用双场景输出,已在医疗影像与工业质检等领域探索落地。
紫东太初是中科院自动化研究所推出的多模态大模型,是国内较早实现图文音三模态统一建模的模型之一。模型支持文本、图像、语音的跨模态理解与生成,在多模态问答、图像描述、语音识别等任务上具备较强能力。紫东太初以认知智能为核心方向,结合中科院自动化所在视觉、语音、语言方面的长期研究积累,面向科研验证与产业应用双场景输出。模型已在医疗影像分析、工业质检、智能安防等领域探索落地,同时为高校和科研机构提供多模态AI研究基座。紫东太初团队持续迭代模型能力,推动从三模态向视频和3D等更多模态扩展,是中国多模态大模型研究的重要力量,在跨模态检索、多模态内容生成等方向形成了丰富的学术成果与产业验证,为多模态AI的学术研究与工程化落地提供了重要参考。