随着信息技术的高速发展,虚拟现实、增强现实等逐渐火热。虚拟现实是一种完全建立虚拟环境,让人类脱离现有环境进入新的世界,它的广泛应用可能还要经过一段时间的积淀,目前虚拟现实主要在科研仿真、虚拟漫游、游戏娱乐、教育培训等领域发挥作用。而从虚拟现实中发展起来的增强现实,旨在增强人类能力,为人类提供各种辅助信息,成为沟通人类个体与信息世界的重要枢纽。目前已经在医疗、交通、教育培训、航天、通信、工业维修等领域发挥作用。相信增强现实的大规模应用会比虚拟现实更早一些,可能取代智能手机,成为下一代智能计算与显示平台,将物理世界与信息世界联系得更加紧密。这里,我们主要谈一下增强现实的相关内容。

增强现实(Augmented Reality,简称AR)技术是一种基于计算机实时计算和多传感器融合,将现实世界与虚拟信息结合起来的技术。该技术通过对人的视觉、听觉、嗅觉、触觉等感受进行模拟和再输出,并将虚拟信息叠加到真实信息上,给人提供超越真实世界感受的体验。目前广泛接受的一种定义是Azume在1997年提出的,他认为AR应该具有三个特征:

我们所要讨论的增强现实,主要是视觉增强现实技术,核心在于虚拟信息和真实世界在物理空间中的匹配以及可视化。增强现实是一个多学科交叉的研究领域,内容纷繁复杂,选取其中某个点深入下去都可以作为长久的研究课题。一个完整的AR系统至少有三个部分:跟踪、注册和显示。

Sutherland在1968年完成了第一台头盔显示器,堪称头盔显示器的开山祖师。不过由于当时技术限制,该设备非常笨重,需要悬挂在房顶上使用,于是被戏称为“达摩克利斯之剑”。

70年代、80年代也有很多研究者做了相关的研究工作,但是直到90年代初期,“Augmented Reality”这个词汇才首次诞生。渐渐地,增强现实脱去虚拟现实的外衣,成为一个独立的研究领域。

随着21世纪初期智能手机的兴起,增强现实有了天然的开发载体,视频式的增强现实迅速发展起来。这也得益于ARToolKit和Vuforia等基于图像的跟踪定位工具的相继推出。如下图,使用智能手机和平板电脑作为平台的增强现实应用,目前已经非常普遍。

但是,智能手机和平板电脑毕竟只是视频式的增强现实,相比于光学式的来说,还是少了一点科技感和刺激感。于是谷歌在2012年发布了Google Glass,为增强现实的发展注入了新的活力。它对于AR发展的作用应该就像是Facebook的Oculus Rift之于虚拟现实一般。2014年3月26日,Facebook宣布将以约20亿美元的总价收购沉浸式虚拟现实技术公司Oculus VR。这一事件极大地推动了虚拟现实的发展。

类似地,Google等商业巨头投身AR,也必将对AR起到巨大作用。尽管后来GoogleGlass停产,但是其作用不可忽视。之后,又有更多的公司推出了自己的光学式增强现实眼镜,最著名的是Microsoft Hololens和Maigc Leap。

近眼式显示设备近眼显示设备主要是指头盔显示器。头盔显示器主要分为两种:光学透射式头盔显示器和视频透射式头盔显示器。当然如果按照显示器件数量,也可以划分为单目头盔显示器和双目头盔显示器。这里主要讨论光学式(左)和视频式(右)的区别。

光学透射式头盔显示器是直接透射外界的光线,并且反射微投影器件产生的虚拟图像到人眼中,达到虚实融合的效果。优点是可以保证正确的视点和清晰的背景,缺点是虚拟信息和真实信息融合度低,且人眼标定比较复杂。目前市面上典型的光学透射式头盔显示器有Hololens和Meta2等。

而视频透射式头盔显示器,是将固定在头盔上的摄像头所捕获的图像,通过视点偏移来显示到眼前的显示器上。优点是虚实融合效果好,无需标定人眼,缺点是视点难以完全补偿到正确的位置,且与镜片范围外的环境不能完美衔接。将上面的光学透射式头盔显示器,加上摄像头,并且把带有增强信息的视频直接全屏显示,就成为了视频透射式设备了。很巧的是,很多光学透射式设备,确实在其上加装了这种摄像头,但是它们的本意是用摄像头来作为跟踪模块的。

手持式显示设备,顾名思义就是拿在手上的显示设备。最常见的就是我们的智能手机和平板电脑。这类设备具有很好的便携性,是一种天然的AR设备。它们有摄像头作为图像输入设备,有自带的处理器,有显示单元,具备了进行AR开发的所有条件。在目前市面上,很多增强现实APP都是围绕这类设备开发的。

桌面级显示器,这是我们日常生活中最常见的一类显示器了。给它添加一个网络摄像头,就可以完成AR任务了。该摄像头可以捕捉空间中的图像,然后估计摄像头的位置和姿态,最后计算生成虚拟信息,并进行虚实融合,输出到桌面显示器上。这类设备适合做一些科研类的开发,对于商业应用显得有些笨重,比起手机和平板来说稍逊一筹。

虚拟镜子,这是利用摄像头对着人进行拍摄,然后输出到一个类似于镜子的大型显示器上,给人一种照镜子的感觉。同时,还可以进行虚拟换装,或者添加一些虚拟物件,达到AR效果。

投影机是一种重要的虚拟现实和增强现实设备。最常见的基于投影的增强现实系统是在展会上的各种绚丽的投影展品,包括虚拟地球、汽车表面投影等。这类系统属于空间增强现实系统。另外,柱幕、球幕、环幕投影也可以归为基于投影的空间增强现实。

投影机还可以用于构建CAVE系统。手持式投影机结合图像捕捉设备,还可以建立动态的空间增强现实系统。

增强现实中主要的显示设备就是以上这些。如果要开展关于显示技术的研究,从硬件方面来讲,就是显示材料、器件的研发。当然这与增强现实并没有高度相关性,只能说显示设备参数的提升,可以间接促进增强现实系统性能提升。但是显示方面,软件还是可以有些值得做的东西,并且与增强现实体验息息相关。那就是头盔显示器的显示畸变校正和投影机画面拼接融合,这些技术都直接影响着增强现实系统虚实融合精度和整体可用性。

研究增强现实技术的人,很多是侧重于系统集成和应用测评,或者是直接将AR系统应用在其他的研究领域。因此,这些人一般不会研究显示元器件的细节,而更加关注如何拿现有的材料或者设备来构建新型显示系统。如果能够做出新的AR系统,并且具有实用意义,也是非常有研究价值的。

跟踪理论会涉及到一些空间坐标转换的基础知识,以摄像机跟踪为例,分为模型坐标空间、世界坐标空间、摄像机坐标空间和图像坐标空间。由于比较细节,这里不展开讨论,相关知识可以查阅计算机视觉书籍即可。这里以不同种类的跟踪系统为例来讨论跟踪技术。

电磁跟踪器是通过一个固定的发射源发射出三维正交的电磁场,接收端通过检测接收到的电磁场的方向和强度来确定位姿。跟踪器则是通过测量一个声音脉冲从发射源到传感器的飞行时间来测量距离。

陀螺仪和线性加速度计都是依靠惯性来进行测量的。陀螺仪测量三轴角度变化,线性加速度计测量位置变化。它们通常会配合使用,并且常以微机电系统(MEMS, Micro-Electro-Mechanical System)的形式存在。

有些跟踪需要对被跟踪的目标预先建模,例如一些图像跟踪工具箱。有的则不需要提前建模,例如同步定位与跟踪技术(SLAM)。多数跟踪是需要提前建立一个待跟踪模型数据库的,然后在运行中实时提取特征并且与数据库中的数据进行比对。而SLAM则可以实时根据获得的特征,自主建立空间地图,并且确定摄像头相对于环境的位置。

目前研究的比较火热的是SLAM。因此,可以研究SLAM中的各个环节,从跟踪、建图、回环检测等角度研究如何提升SLAM系统的精度,以及面对复杂环境的稳定性问题。

(2)照明种类跟踪的稳定性与环境光有关,尤其是基于视觉的跟踪。有些跟踪系统不需要自主添加光源,只是利用环境光,称为被动照明;有些跟踪需要主动发射某种照明光线,来实现其跟踪,称为主动照明。被动照明是比较常见的,例如平面标志跟踪就是在普通的环境照明下实现的。主动照明最典型的就是结构光照明,例如Kinect。还有一种主动发射红外光的OptiTrack系统,做姿态跟踪效果很好。

(3)人工标志与自然特征人工标志指的是人造的用于跟踪的图像标志等。例如二维码、棋盘格等。自然特征指的是自然环境中本身就有的特征,不是人为放置用来跟踪的特征。普通的室内环境、街边的楼宇都可以认为是自然特征。人工标志根据其种类不同,需要特定针对性算法进行检测和跟踪,自然特征通常使用SIFT、SURF、ORB等特征描述子来进行特征提取和跟踪。

笔者认为,纯粹的跟踪技术研究,不仅可以服务于增强现实,也可以服务于虚拟现实,以及其他需要用到该技术的领域。研究跟踪技术,可以从多视图几何方向入手,通过几何的方式来估计位姿。也可以从特征角度入手,针对特定的问题,设计不同的特征表述方式,解决问题。

SLAM研究者们通常会考虑怎样建立更加稳健的SLAM系统,怎样对抗真实环境中的噪声,怎样进行更好的回环检测等。研究惯性测量单元(IMU)与视觉融合进行SLAM的也大有人在,多传感器数据融合对于SLAM来讲有重要的意义。

在研究基于视觉的跟踪技术时,会用到很多计算机视觉算法。计算机视觉本身就是一个很庞大的学科,感兴趣的读者可以根据自己的兴趣,选择相应的书籍进行展开阅读。这里推荐两本书,一本是《计算机视觉——算法与应用》,另一本是《计算机视觉中的多视图几何》。

跟踪、标定和注册是AR系统研究的三个核心问题。前面我们已经讲了跟踪技术,这里将对标定和注册进行叙述。

(2)校正镜头畸变镜头畸变可以分为径向畸变和切向畸变两种。它们也都可以通过标定来确定畸变参数。镜头畸变是普遍存在的,所以在使用之前要记得先进行标定。

对于光学透射式头盔显示器,要进行AR开发的话,必须加上一个摄像头。摄像头与头盔显示器之间的位置关系需要标定。最常用的一种方法是单点主动对准法(SPAAM)。这个方法要求用户佩戴头盔显示器,并且将屏幕上的一些十字光标与真实世界中的物体进行多次对齐,多次对齐需要通过头部转动完成。数据获取后,通过DLT方法构建方程组求解投影矩阵。

(2)使用瞄准转置该方法需要将瞄准装置与显示器上的十字叉丝对准,而不是使用在SPAAM中用到的静止标定点。这种瞄准装置经常是作为AR设备的一部分,并且包括一个触发器来确认对准完成。瞄准装置有一个优势,用户不必再移动头部来完成对准,取而代之的是,可以通过移动手臂来完成。

跟踪系统在进行测量的时候,会存在测量误差,导致位置估计不准。这种误差会导致注册的虚拟物体与真实物体之间会存在不匹配的情况。所以,在每一个步骤要严格控制误差,不要让误差在后面的环节中传播。

对于光学透射式增强现实来说,还有另一个非常重要的问题,那就是延迟。由于真实的环境背景是直接透射进人眼的,可以认为是零延迟的。但是虚拟信息是通过摄像头捕捉环境,建立跟踪注册信息,然后渲染输出到头盔显示器上。这个回路的处理时间导致虚拟信息的渲染比头部转动会有延迟。一个比较有效的方法是在视觉跟踪的基础上,加入高反应速度的IMU,对这种延迟进行补偿。头部的快速运动可以根据IMU的反馈来渲染图像。

摄像头标定本身已经是一个很成熟的领域了,除非有什么新的摄像头类型推出。光学透射式头盔显示器的标定也比较成熟,但是还是存在问题。比如标定程序复杂,不同用户之间通用性低。所以可以根据人眼与HMD之间的特殊性,研究提升标定效果的方法。另外,还可以考虑减小延迟,比如考虑视觉-IMU融合。这种方法已经在Hololens上获得成功应用。减小延迟的方法除了使用视觉-IMU融合,应当还有别的途径,这些都是值得研究的地方。

增强现实系统呈现的效果应该是虚实高度融合的,让人分不清哪里是虚的,哪里是实的。高度融合体现在虚拟物体被放置在正确的位置上,没有与真实物体产生错误的重叠。几何一致性还要求在时间变化中保证几何一致。例如,在光学透射式头盔显示器中,快速的头部运动会导致虚拟图像的渲染落后于真实的环境,导致图像延迟现象。这就违反了几何一致性要求。

另外,虚实遮挡也要保持一致。有的时候虚拟的物体在空间上应该被渲染到真实物体的后面。但是默认情况下,虚拟的物体总会挡在真实物体的前面。因此,必须使用额外的传感器,探测出真实物体的空间位置,然后决定哪些虚拟图像是应该被遮挡起来的。

还有一些研究人员对增强现实头戴式显示器的深度感知一致性做了研究。他们分析了使用双目头盔显示器看到的虚拟物体与真实物体在深度感知上的一致性。

虚拟世界的光线往往是认为设定的,但是真实世界的光线是非常复杂的。因此渲染的虚拟物体怎样保持与真实环境一致的光照效果,也是需要注意的。光照效果如果不一致,尤其是阴影的渲染不一致的话,会导致非常糟糕的效果。解决这个问题的途径是,通过某个方式获得真实环境中的光源分布,然后在虚拟世界中模拟这个光照效果。

视觉一致性分析实际上主要是对增强现实系统的表现进行评价。一旦涉及到用户研究,就有很多值得研究的工作。比如研究AR系统的几何一致性对用户使用头盔效率的影响,以及图像呈现与环境配合关系。尤其是光照研究,自然光照是非常复杂的,要想完全模拟自然光是非常难的。所以这个点上还是有很多值得研究的东西的。

交互听起来有些陌生有些抽象,但是确是一个非常常见的过程。比如,我们日常使用鼠标键盘就是在与计算机进行交互。人机交互就是人与机器之间进行信息沟通的过程。按照交互方式的不同,增强现实中的人机交互技术可以分为多种,下面一一介绍。

传统的交互最被大众熟知。鼠标键盘的几十年发展证明这种人机交互方式非常有效。但是对于增强现实应用,却不一定是最好的结果。一些被广泛用于虚拟现实的设备,例如数据手套、力反馈装置、数据衣等,也可以应用在增强现实中,但是加入这些装置后,会明显觉得环境不协调,对增强现实应用的效果有影响。

人机交互是一个非常大的研究领域,在增强现实中涉及到的人机交互技术也有很多。我们可以针对某种交互形式展开研究,无论是建立人机交互接口,还是评测交互性能,都是一个不错的切入点。相信很多读者都会有兴趣构建一套属于自己的人机交互系统吧。

增强现实中的可视化,主要是对场景中的物体进行标注和解释。对于标注和解释的合理性和正确性,需要经过仔细探究。一个场景中可能有很多东西可以标注,也有很多来自数据库的信息可以呈现。但是如果不加选择全部显示出来,还是会发成数据冗余、屏幕混乱的情况。因此需要对数据进行过滤,考虑两个方面的问题:第一,标注的合理性;第二,数据推送智能性。

根据一个系统中虚拟与现实的占比,可以将系统分为4类:真实现实、增强现实、增强虚拟、虚拟现实。而增强现实和增强虚拟又可以合称混合现实。

从上图可以看出,橙色代表虚拟成分,蓝色代表真实成分。当只有真实世界信息的时候,属于纯粹的真实现实,典型的就是我们带摄像功能的手机,以及我们佩戴的普通眼镜。当系统中既有真实信息又有虚拟信息的时候,叫做混合现实。此时,如果虚拟信息是服务于真实世界的,且数量较少,占次要地位,则归为增强现实,典型系统是手机导航系统;如果虚拟信息是主体,而真实信息是为虚拟信息服务的,那就叫增强虚拟。最后,如果信息全为虚拟,则是虚拟现实,典型系统是各类虚拟现实游戏。

增强现实技术已经发展了几十年,但是还没有达到巅峰。增强现实的推广,还必须依赖于几个方面的进步:

可以预期,在五到十年的时间里,增强现实技术将会取得重大进步。各大科技巨头也将会重点布局这个新兴领域,随之极大推动该产业的发展。增强现实技术与虚拟现实技术、人工智能技术将会紧密结合,形成下一代科技的发力点,极大革新人类的生活方式与生产方式。也许十年、二十年后,增强现实设备就会完全取代智能手机,成为下一代智能计算平台、社交平台和支付平台,带领人类进入全新的发展阶段。

生产力的发展如此迅速,增强现实普及之日并不遥远——然而,当一切构想全部实现,进入“增强现实”时代,等待我们的下一个神奇又会是什么呢?

作者 admin