对于人类来说很容易识别图像,但对机器来说图像识别也经历了很长时间的发展。
在计算机视觉的领域,图像识别近年来得到长足发展。例如,在PASCAL VOC物体进行检测技术基准系统测试中,检测器的性能从企业平均模型准确率30%飙升到了我们今天的超过90%。对于图像分类和图像识别,在机具挑战性的ImageNet数据集上,先进的算法甚至超过了人类目前的表现。
大规模数据集的生成、强大模型的开发和大量可用的计算资源是深度学习的成功主要得益于的三个方面。设计深度神经网络已经远远超越了以前基于人工设计的图像识别特征,对于多种图像识别任务来说。图像识别信息技术的高价值以及应用就发生在你我身边,例如通过视频监控、自动驾驶和智能发展医疗等,而这些图像识别最新研究进展的背后推动力是深度合作学习。
深度合作学习在图像识别技术方面发展就目前来说虽然已经取得了一个巨大成功,不过在它进一步广泛应用之前,仍然还有很多挑战自己需要我们去面对。与此同时,我们在图像识别身上也看到了很多的研究具有未来价值。
图像识别技术在可以被广泛应用之前,怎样才能知道一个系统模型对未曾出现过的场景仍然具有很好的泛化能力,是一个非常重要的挑战。
图像识别在目前的实践中,将数据集随机分为训练集和测试集,并对模型进行相应的训练和评估。需要注意的是,在这种方法中,由于它们都是从具有相似场景内容和成像条件的数据中采样获得,所以测试集拥有和训练集一样的数据分布。
然而,在实际发展应用中,测试图像或许会来自不同于训练时的数据主要分布。这些未曾出现过的数据在图像识别方面可能会与平时数据的视角、规模、场景配置、大小尺寸、摄像机属性有所不同。
目前来说,图像识别重要研究的领域是将常识融入到深入学习中,深度学习主要作为一种纯粹的数据进行驱动技术被我们使用。在深度学习,使用标记的样品的训练集学习的非线性函数的神经网络,这个角色后,学习功能将在测试图像像素,训练集之外的信息则一点也没有被我们所用到。
相反,人类对物体的图像识别不仅基于已经看到的样本,而且还基于它们对现实世界的常识。人们能够推理他们所看到的,为了避免识别结果不符合逻辑的。如何在深度网络中获取、表示常识和使用常识推理是一个挑战。
版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖
Testin云测自动化测试解决方案,以零代码降低门槛、全栈兼容打破生态壁垒、云端集约提升资源效能,助力企业跨越测试鸿沟,赢在数智化时代。
如何构建安全合规、敏捷高效的研发管理体系,已成为金融业高质量发展的关键命题。
腾讯TAPD正在凭借着三大亮点帮助众多互联网企业打破传统管理模式的束缚,实现更加透明、高效的协作。
云巴巴基于多年行业深耕,为大家推荐洞隐科技的智能航运管理平台,为企业开启“智慧航海”新篇章——这不仅是技术的升级,更是一场管理模式的革新。