目标视觉检测是计算机视觉领域中一个非常重要的研究问题。随着电子设备的应用在社会生产和人们生活中越来越普遍,数字图像已经成为不可缺少的信息媒介,每时每刻都在产生海量的图像数据。与此同时,对图像中的目标进行准确识别变得越来越重要。下面盈泰德科技就来解析深度学习在目标视觉检测系统中的应用进展。

我们不仅关注对图像的简单分类,而且希望能够准确获得图像中存在的感兴趣目标及其位置,并将这些信息应用到视频监控、自主驾驶、人机交互等一系列现实任务中,因此目标视觉检测技术受到了广泛关注。

一、传统的目标视觉检测技术

传统的目标视觉检测技术在流程上大致分为三个步骤: 区域建议(Region proposal)、特征表示(Feature
representation)和区域分类(Region
classification),如图1所示。该基本流程被许多工作所采用,它们在目标区域建议、图像特征表示、候选区域分类上分别采用了不同的处理策略。近年来,随着深度学习技术的发展,很多基于深度学习的目标视觉检测算法陆续被提出,成为研究热点。

 

深度学习在目标视觉检测中的应用进展-机器视觉_视觉检测设备_3D视觉_缺陷检测  图1 目标视觉检测的基本流程

 

 二、基于深度学习的目标视觉检测算法

深度学习模型具有强大的表征和建模能力,通过监督或非监督的训练方式,能够逐层、自动地学习目标的特征表示,实现对物体层次化的抽象和描述。在图像识别领域中,Krizhevsky等于2012年构建深度卷积神经网络(CNN),在大规模图像分类任务上取得了巨大成功,引起了对CNN模型的高度重视,也因此推动了目标检测的研究进展。本文首先介绍了图像分类中经典的AlexNet及其改进模型ZFNet、VGG、GoogLeNet、ResNet等。随着模型变得越来越深,图像分类的Top-5错误率也越来越低,目前已经降低到3%以下。与图像分类一样,目标检测的输入也是整幅图像,它们在特征表示、分类器设计上具有很大的相通性。通过采用这些CNN模型得到更强大的特征表示,然后应用到目标检测任务,可以获得更高的检测精度。本文从基于区域建议的方法和无区域建议的方法两个方面来介绍深度学习在目标视觉检测中的研究现状,并汇总了公开的实验结果进行定量比较。

 

深度学习在目标视觉检测中的应用进展-机器视觉_视觉检测设备_3D视觉_缺陷检测  图2 平行视觉的基本框架

然后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,例如深度学习理论还不完善、大规模多样性数据集还很缺乏。为了解决这些问题,我们认为可以采用平行视觉的思路来进行研究。通过“平行执行”在线优化视觉系统,能够激发深度学习的潜力。我们相信,深度学习与平行视觉相结合,必将大力推动目标视觉检测的研究和应用进展。

盈泰德科技(深圳)有限公司有着多年的机器视觉行业经验,在机器视觉的应用领域上积累了丰富的经验,有着不少成功的案例和解决方案,盈泰德科技一直以来致力于机器视觉产品的生产、开发、应用以及销售,为客户提供整体机器视觉解决方案及服务,把机器视觉技术应用到智能生产中。(http://www.0755vc.com/)