(一)“通用式三维即时成像技术”的研制目的和主要思路
目前能够自动实现三维立体图像视觉测量的系统,一般采用的技术手段是线激光光截图测量技术或双目加结构光的测量技术。
这些技术的主要问题是:①在室外阳光下使用时,可对成像造成强烈干扰,不能满足成像质量要求;②这些方式对于吸光面、大曲面、强反射光滑面,不能形成良好反射,影响检测效果;③当激光功率太小时,测量深度会减小,测量精度会下降,当激光功率加大时,又容易造成使用者或被测物的伤害;④采用结构光等主动成像方式只能是在结构光照到的位置进行检测,对于结构光之间的空隙,无法形成三维测量数据,做到对被测物细部特征的三维成像;⑤由于结构光照到的部位和其它照不到的位置在成像时的高对比度要求,使被测物的颜色和纹理无法同步测量和展示。
考虑到上述问题,采用基于双目视觉测量技术中的被动式纯光学成像的技术,是符合“机器眼”三维成像目标要求的技术。单纯使用双目匹配算法实现三维立体图像计算,目前广泛应用在航测领域,但该方法在计算三维时,需要人工干预,且大都采用后期处理的方式,难以采用一套程序自动完成。
双目加结构光这种三维测量方式,就像求解一个线性方程组,要得到解,方程的数量与变量的数量至少必须一致,如果方程数量不足,就变成了不定解方程,就需要增加方程数量或再给出其它的已知条件。结构光等三维成像时的辅助手段,都可以理解为增加了额外的解方程前的已知条件,由于有了这些已知条件的存在,虽然足以能够得出方程解,但这些手段的多样性和复杂性,使这样的三维测量难以满足通用性的要求,同时,极大限制了该类测量系统的应用范围和测量效果。
按照画法几何的原理,描述三维物体时一般采用的是三视图的方式。如果只用两个视图,在一些空间结构体的理解上难免会出现歧义。对于纯双目匹配必然带来歧义性这样的命题,虽然目前还没有严格意义上的几何学证明,但从目前涌现的三维实时测量系统中大量采用双目加结构光的模式来看,依靠纯双目三维测量确实难以实现自动化实时检测。其可能的原因就是由于双目匹配空间几何解算的条件不足,造成了匹配上可能的歧义。
目前流行的双目或多目图像测量系统,一般采用的方式是将各相机呈角度布置,这样能够扩大测量视场范围,提高测量精度。但在图像匹配运算时需要根据相机间的夹角以及被视物的空间位置,首先在采集图像上计算出匹配极线。空间位置不同,极线在图像上的角度不同,成为了一条斜率不固定的斜线。图像匹配时,就需要按照这条斜率不固定的斜线进行像素搜索和匹配,搜寻范围不能确定,运算工作量大。
基于以上思考,北京清影公司设计开发了一套建立在四像机组平面阵列基础上的纯图像三维测量系统,该系统至少包括一组组成2×2阵列的四台数码相机,其运算过程是对像机组采集的图像进行匹配运算;根据匹配好的像素点像坐标,计算各个像素点的空间位置坐标;根据空间位置坐标,形成三维点云数据;建立三维点云图形,进行三维立体重现。
(二)“通用式三维即时成像技术”介绍
“通用式三维即时成像技术”采用四像机组平面阵列硬件形式,后台配置通用三维算法,能够全自动、快速完成对相机视场内被视物体空间关系的解构。北京清影公司经过一年努力,已经完成了全套软硬件系统的研制,包括:专用三维相机、三维运算软件和三维立体显示软件等。在普通光照条件下,在不到1秒时间内实现被视环境的三维快速成像。同时,申请了11项发明,已经获得1项发明和5项实用新型授权,打造出以“通用式三维即时成像技术”为核心的完整技术体系。
“通用式三维即时成像技术”的三维运算,是采用几何学的方法完成。其具体步骤是将相机组的四幅同步图像的幅与幅之间,按像素点逐点在水平和垂直方向进行两两匹配运算。四组图像之间通过几何关系形成关联,互相印证,排除那些不符合几何投影规律的匹配关系以后,技术上完全能够实现运算的通用化,消除双目匹配存在的歧义性问题,实现像素间确定和的匹配。匹配完成后,通过匹配像素点的视差计算,直接得出被视点的三维空间坐标,以三维点云形式实现三维显示。
以上方法,可以用物理定理来类比理解。例如物体运动满足牛顿定理的前提条件是光滑平面且不考虑风的阻力等条件,图像间的匹配也是同样。当四相机呈矩形阵列平行布置时,相邻两相机之间的像素匹配就简化为水平或垂直匹配,这样匹配运算就由全图面运算变为水平或垂直的直线运算,匹配范围由面缩小为一条直线,增加了空间解算的确定性,极大提高了运算速度。当四组图像两两匹配时,就类似于把四个匹配过程在空间相交为逐个确定的点。形成确定且三维空间解算几何结构。
“通用式三维即时成像技术”通过空间几何的解算,直接跨过各类图像处理的复杂算法,实现利用多目相机纯图像解算,直接测量被视环境中物体的三维尺寸。该方法简单、快速、准确,可实现标准化程序运算。该技术采用四像机组平面阵列的方式,在任何光照条件下,对任何物体,采用完全相同的匹配算法和步骤就可以实现被视物的三维测量。实现了真正的“所见即所得”的三维机器视觉。
(三)“通用式三维即时成像技术”主要功能
“通用式三维即时成像技术”的主要功能表现在以下几个方面:
1、 使用普通工业相机搭建多目相机组,实现任意环境的下光学被动三维成像,不依赖于结构光、事先标定等任何辅助手段;
2、 能够实时抓取被视物的主要视觉特征,秒级时间内直接得到物体轮廓及其空间三维数据,快速实现物体与背景的分离和切割;
3、 硬件结构简单、软件完全通用、操作使用方便。彻底摆脱对专业人员、专业设备和专业技能的依赖,傻瓜相机式的操作体验,随时随地的三维测量结果输出;
4、 硬件采用工业相机组,技术成熟可靠、成本低,成像作业过程简单。
(四)“通用式三维即时成像技术”应用前景
机器视觉作为人工智能与工业4.0领域的关键技术,在今后5~10年内将迎来井喷式的发展,其广泛的应用范围,有望创造出千亿、以至万亿级的市场机遇。
“通用式三维即时成像技术”作为一种具有高度通用性、灵活性的视觉感知技术,在以下应用方面,提供了一种全新用户体验,极大提升了人工智能的成长空间:
可应用于无人汽车,作为主要视觉装置部分替代当前使用的景深相机和激光雷达;
可与智能手机相结合,形成普通用户均可以操作使用的便携式三维成像终端,供警察、律师、医生、电商、建筑设计师、机械工程师等专业人士使用;
可应用于AR、VR以及3D打印领域,作为主要的前端视觉成像设备,快速、低成本地搭建景物的三维图像;
可应用于军事领域,配置在单兵头盔、战车和战机上,实现对复杂战场环境的快速侦测感知;
可应用于公安反恐与金融支付领域,对人脸实现三维建模和任意角度的二维识别;
可配置给各种类型的机器人作为视觉感知终端使用,通过提供完整的视觉信息,极大提升无人系统的智能化程度。
“通用式三维即时成像技术”,我们的一小步,机器视觉的一大步。
图1、清影三维立体相机
图2、楼房照片
图3、楼房3维立体照片
图4、花的三维立体照片
图5、花的照片