我国学者墨子和他的学生,做了世界上第一个小孔成倒像的实验,解释了小孔成倒像的原因,指出了光沿直线进行的性质。2000多年后的今天,机器视觉技术变得越来越复杂,工业领域的图像处理更多的专注于3D传感器,而且越来越多的技术已经完善并且投入到实际应用中,包括焊缝的检测,以及在生产过程中对未分类部件进行仓拣或精确测量金属板。可以说,机器视觉已经转向了3D成像。
GGII数据显示,2019年中国机器视觉市场规模65.50亿元(该数据未包含计算机视觉市场规模),同比增长21.77%。2014-2019年复合增长率为28.36%。GGII预测,到2023年中国机器视觉市场规模将达到155.6亿元。
机器视觉典型应用
机器视觉,或者说计算机分析和预测图像内容的能力,通常只取决于输入的图像的好坏。这就是为什么工程师们一直孜孜不倦地从硬件和软件的角度创造出新的、更好的三维成像技术手段的原因。
什么是3D成像?
在研究成像时,工程师可以从人眼捕获和解释图像的方式中找到灵感。
一种视差模拟相机的工作原理
人类视觉系统的工作方式是,每只眼睛从不同的角度观看世界,并通过称为视差的过程将这些图像合并为一个图像。3D成像采用相同的方法,每次拍摄都使用两个镜头,每个镜头拍摄的图像彼此都不相同。
主动与被动3D成像
3D成像技术按照工作原理,首先分为被动式和主动式两类。
被动式视觉效仿生物的双眼视觉(binocular vision)原理,由至少2枚图像传感器(image sensor)构成,运用其观测对象在每个图像传感器单独成像的位置,结合2枚图像传感器的相对物理位置,根据几何关系测量原理,可以计算出景深(depth),如下图所示。
双目视觉系统的核心在于关联同一观测点在各自图像传感器中的坐标位置,如上图的左图所示。然而,在实际使用中,由于受到外部环境和拍摄对象表面纹理属性等客观因素影响,特征点自动匹配在算法上较为复杂,匹配精度也直接影响到景深计算精度,影响系统整体效果。
主动式视觉系统则由于其工作原理的不同,有效解决了这一问题。
主动式视觉系统利用独立的人工光源,主动投射到观测对象来测量景深。主动式视觉根据投射光源和景深技术原理的不同,又分为三小类:三角测距法、结构光法、飞行时间法。如下图所示。下面做详细介绍:
主动视觉系统分类
(1)三角测距法(triangular)
三角测距法是利用投射光源、观测对象和接收图像传感器的空间位置,利用三角几何学计算景深的方法。此方法是众多主动式3D景深视觉系统的底层基础算法。
(2)结构光法(structured light)
结构光法可以认为是针对在被动式视觉系统中特征点匹配问题的对策性方案。如下图所示,结构光的含义是主动光源通过特定图案编码投射到被测物体,例如将分布较密集的均匀光栅投影到被测物体上面,由于被测物体表面的不规则性具有的不同深度,反射到图像传感器的光栅条纹会有所变形,这个过程可以看作是由物体表面的深度信息对光栅的条纹进行了调制。通过对比图像传感器接收到的发生畸变的光栅图案和原生图案,就可以解析出每个观测点的深度信息,形成深度点云(point cloud),即深度帧(depth frame)。
结构光景深成像原理示意图
(3)飞行时间法(time of flight)
飞行时间又称TOF,简要来说,是基于测量投射的光源信号发射与接收之间的时间差,计算出景深或距离的一种景深计算方法。
TOF根据如何测量时间差又可细分为脉冲波测距和连续波测距。脉冲波测距原理是直接测量脉冲信号发射和接收的时间差;连续波测距则是通过连续发射整数波长,通过计算接收波与发射波之间的相位差,间接计算时间差,如下图所示。
TOF景深成像原理示意图
3D成像应用
许多领域可以极大地受益于3D成像。
目前比较热门的应用就是自动驾驶汽车。随着3D成像技术的改进,自动驾驶汽车的视觉系统将会更好,让它们实时做出更准确、更安全的决策。另外增强现实也是将受益于3D成像应用。
除了机器视觉,医学领域尤其可以看到许多值得注意的应用,3D成像在超声、心脏探查和外科视觉等领域的应用将极大地造福于医生和患者。
视觉引导脊柱外科手术
3D成像是已成为科技领域热门领域之一,随着技术在电路层面的不断完善,很多领域都可能将3D成像确立为一项司空见惯的技术。