A. VR中的光学定位及姿态捕捉技术难点在哪
VR定位动捕技术难点在哪看4大因素要考虑
最近有文章解析了因为追星仪和陀螺仪的出错,加上科学家写反喷气代码导致了造成了价值19亿的一台名为逗瞳地的X射线太空望远镜被玩坏了。实际上,追星仪和陀螺仪实现的类似于VR中的光学定位及姿态捕捉。一直以来,大家都在说VR定位动捕技术难,那到底难在哪里呢看作者系VR行业从业者,本文将会探讨下这个问题。
我相信,逗瞳地真实的毁灭原因一定比文章中描述的要复杂很多,我写这篇文章也不是为了跟大家探讨逗瞳地,而是想跟大家聊一下由此事件引发的一些思考。
| 逗瞳地和VR中的光学定位及姿态捕捉
瞳的追星仪,在文章中是这样描述的逗追星仪是卫星上一个判断自己方位的仪器……总的来说就是一个小相机,通过跟踪拍摄背景里一些亮的星星的位置… 用来判断自己所指向的方位……地。
为什么总说VR定位动捕技术难,它究竟难在哪里看
追星仪的定位技术大概是目标物体(即瞳本身)拍摄背景中的星星,根据得到的图像及所识别出的星星的位置来获取自身的方位信息。而瞳的陀螺仪则用来侦测瞳自身的空间姿态。所以,追星仪和陀螺仪实际上实现的类似于VR中的光学定位及姿态捕捉。
(1) 光学定位技术
VR中的光学定位技术是利用摄像机拍摄目标物体,根据得到的目标图像及摄像机自身的位置信息推算出目标物体的位置及姿态等信息。根据标记点发光技术不同,光学定位技术还分为主动式和被动式两种。
具体实现流程:定位物体上布满标记点,标记点可以自主发射光信号或者反射定位系统发射来的点信号,使得摄像头拍摄的图像中标记点与周围环境可以明显区分。摄像机捕捉到目标物上标记点后,将多台摄像机从不同角度采集到的图像传输到计算机中,再通过视觉算法过滤掉无用的信息,从而获得标记点的位置。该定位法需要多个 CCD 对目标进行跟踪定位,需要至少两幅以上的具有相同标记点的图像进行亚像素提取、匹配操作计算出目标物的空间位置。实现流程图如下:
为什么总说VR定位动捕技术难,它究竟难在哪里看
光学定位技术实现流程
目前,光学定位技术在国际上最受认可的是Optitrack。OptiTrack定位方案适用于游戏与动画制作,运动跟踪,力学分析,以及投影映射等多种应用方向,在VR行业有着非常大的影响力。
为什么总说VR定位动捕技术难,它究竟难在哪里看
(2)惯性动作捕捉
陀螺仪的工作原理是通过测量三维坐标系内陀螺转子的垂直轴与固定方向之间的夹角,并计算角速度,通过夹角和角速度来判别物体在三维空间的运动状态。
它的强项在于测量设备自身的旋转运动。陀螺仪用于姿态捕捉,集成了加速度计和磁力计后,共同应用在惯性动作捕捉系统。
惯性动作捕捉系统需要在运动物体的重要节点佩戴集成加速度计,陀螺仪和磁力计等惯性传感器设备,传感器设备捕捉目标物体的运动数据,包括身体部位的姿态、方位等信息,再将这些数据通过数据传输设备传输到数据处理设备中,经过数据修正、处理后,最终建立起三维模型,并使得三维模型随着运动物体真正、自然地运动起来。
为什么总说VR定位动捕技术难,它究竟难在哪里看
| VR定位动捕技术到底难在哪里看
前文提到,逗瞳地最终没有避免毁灭的命运,当然我们得说这次毁灭有一些人为的可避免的错误造成,但无法否认的事实是它耗费了人类价值19亿的资源。这也从侧面证实了定位及动捕技术难度之高。
当然,应用于VR行业中时,对于精度等的要求不会有逗瞳地那么高,但为了能给使用者带来超强沉浸感体验,定位及动捕的精度、延迟、刷新率等也一定要达到非常高的水平。很多人知道2016年被称为VR的元年,但是又有多少人知道VR自1963年被提出至今耗费了多少科学家、工程师的心血看
读者可能会有疑问,大家一直在说VR定位动捕技术难,那到底难在哪里呢看接下来笔者就来谈谈VR定位动捕技术的难点。
(1)人体运动复杂性
由于在现实世界里面,逗场景地是相对静止的,我们之所以看到眼前的东西在动,是因为我们头部、眼部、身体等在移动,使得眼前的逗场景地形成了一个动画。而虚拟现实就是要模拟出现实世界的这种逗动画地,也就是说在虚拟现实的设备中,画面要根据人的这些动作做出相应的调整才可以,而这些动作看似使用定位、陀螺仪等设备就可以解决,但其实则不然。人体的动作可以看作是复杂且有一定规律的一系列动作组合而成,为了完成一个动作,每一个完整的动都可以分解为各个肢体的动作,各个肢体之间的动作既相互独立又相互限制。人体的各种动作是有多个自由度组成,其复杂性使得计算机追踪时存在着很多的困难和挑战。
这里给大家举个例子:
在一些大家很喜欢的搏斗或者射击游戏中,我们经常需要作出身体快速移动,头部快速转动,以及高速的转身、下蹲等动作,一方面这些动作会带来我们实现的变化,眼前所看到的画面也会跟随变化,且虚实情况也有区别;
另一方面,这些动作也必须会带来虚拟世界中的一些反馈,例如瞄准僵尸打出一颗子弹,则虚拟世界中的僵尸将受伤或者倒下。想要让使用者有真实的体验,那么追踪技术就必须可以已非常高的精度实现定位及动捕,否则就不能算是真正的虚拟现实了。
为什么总说VR定位动捕技术难,它究竟难在哪里看
(2)精度问题
定位及动作捕捉精度,对于VR设备非常的重要。如果定位及动作捕捉精度不够高,会严重影响VR体验效果,也失去了虚拟现实的本质。影响精度问题的因素包括遮挡、干扰以及算法自身的限制等。
遮挡是各种定位及动捕系统最常见的工作失效原因之一。
例如光学定位系统中:当扫描光线被用户或物体遮挡时,空间点三维重构由于缺少必要的二维图像中的特征点间对应信息,容易导致定位跟踪失败。遮挡问题可以通过多视角光学系统来减轻,但这又造成了该系统又一大缺陷——价格过于昂贵。以Optitrack为例,Optitrack是国际上非常受认可的光学定位技术,如果有足够的摄像机,Optitrack定位及动捕技术可以很好地解决遮挡问题,具有非常高的精度。但是Optitrack摄像机的价格却让多添加几个摄像机变得不那么容易。
干扰包括外界电磁波干扰和自身设备间相互干扰。不管是光学定位还是激光定位,对外界的电磁波干扰都非常敏感,特别是当设备使用无线的方式通信时,如果存在同波段的电磁干扰,就会造成卡顿、失灵等现象,严重影响体验效果。
为什么总说VR定位动捕技术难,它究竟难在哪里看
还有一个因素是算法本身的限制,例如惯性式动作捕捉技术。
惯性式动作捕捉系统采用MEMS三轴陀螺仪、三轴加速度计和三轴磁力计组成的惯性测量单元(IMU, Inertial Measurement Unit)来测量传感器的运动参数。而由IMU所测得的传感器运动参数有严重噪声干扰,MEMS 器件又存在明显的零偏和漂移, 使得惯性式动作捕捉系统无法长时间地对人体姿态进行精确的跟踪。
目前对于这个问题,G-Wearables的解决方案或许可以参考,其利用激光定位、反向动力学、惯性式动作捕捉相融合的算法来解决,从CES Asia展会上发布的STEPVR大盒子的体验来看,融合算法确实较好地解决了惯性式动捕的零偏和漂移问题,实现了1:1精准的动作还原。当然,这款产品的其他方面还需要消费者们自行去体验,与本文主题无关就不再赘述。
为什么总说VR定位动捕技术难,它究竟难在哪里看
(3)快速运动时的定位及动捕问题
快速运动时的定位及动捕一直是VR行业一大难题,甚至现在很多公司都放弃了快速运动时的定位及动捕,通过VR内容控制用户不要有快速的动作来避免这一问题,但这终究无法从根源上解决问题。
那为什么说,快速运动时的定位及动捕难呢看
对于光学定位来说,难点在于运动模糊。
如果目标物体移动过于快速,则会出现运动模糊,即由于摄像设备和目标在曝光瞬间存在相对运动而形成的一种现象。这种现象很常见,我们平时用手机拍摄人物时,如果人物快速移动(例如奔跑、迅速起身等),则我们拍摄的图片即是模糊的,在VR的光学定位中是一样的。
光学定位系统利用多台摄像头拍摄目标物体,再利用所获得的图像信息及摄像头的位置信息来最终推算目标的空间位置,并基于这样的空间位置通过IK算法或者惯性传感器等来推算目标物体的动作。那么如果目标物体处于快速运动中,则摄像头拍摄的图像就存在模糊,信息不可用,也就无法实现精准的定位。因此基于光学定位的VR系统,在目标物体快速移动时会出现卡顿、跳点等现象。
为什么总说VR定位动捕技术难,它究竟难在哪里看
对于激光定位技术来说,难点在于两束激光扫描存在时间间隔。
激光定位技术需要水平、垂直两个方向上的激光扇面对整个定位空间进行扫描,目标物体绑定的传感器必须接收到水平、垂直两个方向上的激光后方可进行定位,缺一不可。然而,这两个方向上的激光扇面是先后扫描,也就是存在时间差,如果目标物体迅速移动,则会出现水平和垂直两个方向上激光扫描到传感器时传感器所在的位置不一样,也就无法定位准确,进而影响动作捕捉。
B. vr大空间定位多少钱一次
VR大空间的收费目前还是比较贵的,我店里是按人头计算的,一个人68一次,一专次十几分属钟左右,而且一般都是两三个人一起玩,比普通的站桩的VR还是要受欢迎一些,可以一边玩一边交流配合,游戏用的造梦科技的游戏。
C. VR体验馆之痛 如何选择合适的室内定位系统
室内定位常用的定位方案,从技术上来说,主要分为WiFi定位技术、惯性导航技术、蓝牙技术、RFID技术、红外技术、超声波技术、超宽带技术、LED可见光技术。室内定位技术众多,各种技术都有自己的局限性,彼此间又在一定程度上存在互相竞争。作为用户,肯定是更倾向于选择满足定位精度的同时,整体方案实施难度更小,成本更可控的室内定位方案。
主要室内定位方案对比:
从实际应用看:以蓝牙室内定位方案为例,基于蓝牙技术室内定位方案可分为蓝牙信标方案和蓝牙网关方案,怎么选择?很简单,您实际应用中是要实现定位功能,还是导航功能。在之前的蓝牙室内定位方案介绍中,SKYLAB君就很详细的介绍过两者的区别:蓝牙信标方案(VG01/VG02)也就是我们常说的终端侧定位方案,需要依靠手机才能够知道位置,属于主动定位,能够实现室内环境内的导航服务;蓝牙网关方案(TD03/TD05/TD05A)也就是我们常说的网络测定位方案,旨在让别人知道所在的位置,属于被动定位,在很大程度上能够满足室内资产的定位需求。
SKYLAB的终端侧定位可应用于室内定位、导航,营销路径规划,反向寻车,精准位置营销等用户终端。而网络侧定位可用于人员跟踪定位,智能考勤,门禁系统,资产定位及客流分析等场景之中。目前,天工测控的室内定位解决方案多以定制开发为主,毕竟各个行业领域的客户应用需求各有不同,希望能够帮助到您。
D. 一套定位器怎么定位两台HTC VR头盔
一套追踪器追踪多套头盔和控制器是可以的,只是每套头显与控制器都各专自需要一部电脑。只要属把头显与控制器放入基站的游戏区范围,电脑就会自动捕捉了。
一套定位器可追踪4-5套头显和控制器。一个定位器可追踪前方扇形120度的空间,如下图,若是要将两个定位器安装在同一面墙上,后方可能会失去追踪,这部份还请注意。
1. 两套Vive头显与手柄,可以共用一套定位器。
2. 定位器的宽间无法因此扩大,两套头显和手柄还是只能在此定位器的限定宽间范围内进行活动。
E. 定位动捕背后 VR的算法都有哪些
1、FK算法
运动分为正向运动和反向运动。FK是 forward kinematics的缩写, 即正向动力学;IK是Inverse Kinematics的缩写,即反向运动学。人体的分级结构骨架,由许多采用分级方式组的环节链构成,包括分级结构关节或链,运动约束和效应器,由效应器带动所有部分同时运动。
例如,肩关节、肘关节、腕关节及其子骨骼就是一条环节链,也就是运动链,是整个人体运动链上的一条分支,而我们的身体即是利用运动链对运动进行控制的。已知链上各个关节旋转角,求各关节的位置信息和末端效应器(end effector)的位置信息,这是正向运动学的问题;而己知末端效应器的位置信息,反求其祖先关节的旋转角和位置,这就是反向运动学。
2、 IK算法
接下来我给大家介绍一下IK,即反向动力学。
上文已经介绍了IK算法所要解决的问题,我再以投球动作为例说明:如果我们知道出球的起始位置、最终位置和路径,那么投球者手臂等的转动即可按反向运动学自动算出。 反向运动学方法在一定程度上减轻了正向运动学方法的繁琐工作,是生成逼真关节运动的最好方法之一。
3、PNP
PNP准确来说是一个问题,PNP 问题是由 Fisher 和 Bolles于 1981 年提出的。
PNP 问题的具体表述如下:在已知给定n个特征点中任意两个特征点之间的距离以及这两个特征点与光心所成的角度,来求解各特征点与光心的距离,这就是PNP问题。 PNP的主要用处就是可以确定目标物体上的n个特征点在摄像机坐标系下的坐标,然后根据标定获取的摄像机内外部参数,求算出特征点在世界坐标系下的坐标值,最终给出目标的位姿信息。
F. VR定位
现在已经有了手势定位、头部移动定位和眼球追踪定位,在智壹VR网有说
G. VR定位技术是则怎么实现的
VR最大的特点是,给我们带来了前所未有的沉静感.这种沉浸感一方面依赖于光学透镜版产生了大的视场权角,包裹玩家的视野,像观看IMAX电影一样身临其境,另一方面来自于你的每一个交互(头戴设备和控制设备的移动、旋转)都能在虚拟世界中产生相应的效果,给你”就在现场”的感觉.而这这样的效果是离不开VR的定位追踪技术的.
VR的定位追踪技术主要用来解决设备的六个自由度问题。其中六个自由度(6DOF)是指刚体在三维空间中的自由运动.具体而言,刚体可以自由的在三维空间中向前/向后,向上/向下,向左/向右平移,以及三个互相垂直的轴的姿态变化,这个姿态变化我们称为pitch,yaw以及roll
如果离开了定位追踪技术,VR将毫无沉浸感可言。
H. 一文读懂VR世界的“空间定位”是个什么鬼
前不久的OC3大会上,Oculus发布了Touch手柄和-scale(房间级)空间定位方案,算上早就发布了Lighthouse系统的HTC VIVE以及带上PS camera就能玩空间定位的PSVR,虚拟现实头显三巨头都算是进入了光学追踪定位的VR交互新时代。
说到底,光学空间定位到底是如何实现?三大头显厂商的定位方案又有何优劣?未来VR交互又会向什么样的方向发展?
青亭网采访了专注于红外光学追踪研发的青瞳视觉,他们的CEO张海威向我们介绍了目前市场上主要的定位技术的优劣,并用自家产品演示了光学定位的工作原理。
三种交互方案,为什么最看好outside-in?
目前市场上主流的VR交互有三种:inside-in、outside-in以及inside-out,对于这三种方式的优劣,张海威谈了谈自己的看法。
张海威先用一个比喻形象的说明了一下VR交互的命名方式。他把inside形容为“猎手”,比如记录光学信息的摄像头或者记录惯性信息的陀螺仪;out则被他看作“捕猎目标”,比如光学mark点。而in和out则表示“猎手”和“目标”是否在定位对象(比如人或者VR头显)上面。
Inside-out方案是把相机这样的传感器放在身上,用来感知外界的环境,这种方案广泛应用于机器人的机械视觉以及Hololens等手势识别上。包括SLAM等公司,把相机装在机器人身上,对机器人周边的光学环境进行采集、处理,再与机器人的实际位置联系起来实现自主导航。
这种方案的好处是不需要在外界设置摄像头,可以减少场景的限制。但是由于只能识别头部动作,加上体积、续航等领域存在问题,因此它更适合于移动VR这种轻交互场合。
Inside-in就是指传感器和定位点都在目标身上,最典型的就是惯性动捕:让人穿上惯性捕捉设备来记录人体的移动,或者移动VR中头显、手机里的陀螺仪设备记录头部的六自由度移动。
这种方式的好处是不依赖于外界的设备,更加自由,但坏处就是没有位置信息,只能记录移动的轨迹,而目前所有的陀螺仪设备都有累积误差,会导致人在VR中移动的时候“走偏”。
Outside-in则是包括青瞳MC1300、optitrack系列这样,相机放在外头,mark点在人体或者头显上面。这种方式精确度更高,但坏处是一方面要借助外面的摄像头,对空间要求更大,另一方面则是相对成本更高。
在张海威看来,目前的技术都不完美,他认为对于固定场景的VR,outside-in类型的方案目前看起来相对成熟,而随着市场的发展,困扰这套方案最大的问题,摄像头的成本也会逐渐降低,所以张海威也选择用这种方案切入VR市场。
产品体验:精度高延迟低,小问题瑕不掩瑜
在位于上海大学校园内的青瞳视觉总部,青亭网体验了青瞳视觉的光学追踪产品。
进入青瞳视觉的实验室,在工作人员的帮助下,笔者戴上了上面粘着数个反光球的Oculus Rift头显,以及同样粘着数个反光球的手套和一个枪型手柄。
接下来,工作人员启动了一个青瞳自制的demo游戏——笔者进入到一个机械空间之中,游戏本身很简单,就是用手中的激光枪和巨大的机甲战斗。
游戏中,整个空间的稳定性,在空间中行走、躲避的实时反馈都非常精确,包括用枪射击的时候准星也非常稳定。唯一美中不足的是,在游戏的时候,游戏中的手部有的时候会突然地丢失。
对此张海威介绍,这是因为手套的mark点都集中在手背部,翻掌或者被遮挡的情况下,摄像头捕捉不到mark点就会丢失,在实际的商业应用中,mark点覆盖手的两面,就可以解决这个问题。
降低延迟,二代产品的功夫在“机内”
对于VR来说,交互系统的延迟对人们的VR体验有着决定性的作用,对于降低光学交互系统的延迟,张海威表示其实最重要的功夫是在机内的芯片算法里。
青瞳视觉之前推出了一代产品MC300 tracker,而经过一年多的研发,这次推出的二代产品MC1300 tracker,如上图所示,在硬件和性能上都有了很大的进步。以FPGA为核心的带有1GB DDR3内存的拇指大小的微型电脑,处理速度及刷新率大大的提升,降低了延迟,提升了帧率,使得二代产品可以更好的捕捉高速运动中的物体。
当然这并不代表青瞳的水平已经超过Optitrack这样的国际一流大厂,笔者调查后发现optitrack的产品线中也有Prime 13W这样的广角摄像头方案。Prime13W的水平视角为82度,与MC1300的视场角相近。
实现Lighthouse并不困难,算法里面的门道才是壁垒
对于自家的产品,张海威有一个非常形象的介绍:如果说虚拟现实是PC之后下一代的计算平台,那么光学追踪系统就鼠标、键盘一样,用来让人和虚拟现实的世界进行交互。
青瞳自家的红外光学方案主要分为三个部分,摄像头、标记点以及处理系统。摄像头上感光镜头周围有一圈小的led灯泡,发出的光线照射到反光球上,经过反射被摄像头里的感光芯片捕捉,通过内置芯片的计算,最终得出反光球在空间中的位置信息。
只要空间中能有两个摄像头同时捕捉到这个反光球,就可以通过算法计算出这个反光球在空间中的三维位置。
张海威介绍,在摄像头的“眼”中,每个小球就像是一个发亮的点。通过在一个现实中的物体上(比如VR头显)固定住数个不等的小球,记录下这些小球的移动信息,再通过小球间的位置关系确定头显在虚拟空间中的姿态和移动,从而计算出头显在一定场景中六自由度的运动信息。
以头显为例,假设一个人在戴上头显之后想看旁边的柱子,转头的时候会被光学追踪系统记录下来传输给电脑,电脑的CPU计算出人应该看到的画面是柱子,GPU会渲染出相应的画面并显示在头显的屏幕。
张海威表示,青瞳也研究过Steam的Lighthouse系统,并且称它实现起来“并不困难”,真正的技术含量是在软件层——两个基站即便是被遮蔽一个也能正常工作,这一点是其他包括青瞳在内的算法做不到的。
至于Oculus的追踪系统,张海威称二者原理类似,但他更看好Lighthouse,因为相比Oculus的系统,前者对硬件的要求更低,成本更低,稳定性也更好。
I. VR营销平台如何精准锁定目标群体
VR可以应用在多领域中,工业,医疗,旅游,教育,建筑,房产等方面。定位目标看你想涉及哪个领域了。营销平台首先肯定是自媒体微信微博以及网站搭建了。还要看你定位的是高端客户还是中低端客户了。
J. 大朋E3定位版可以玩哪些VR游戏
相同点:都采用outside-in方案,精准性、实时性等技术指标相较inside-out会有较大改善。专提供了更好更真实的交互体验属。缺点是需要外部有固定的基站作为参考。两者都采用被评价为“殿堂级的”激光定位解决方案,优势在于精度与实时性优异、抗干扰与遮挡能力超强、运算量小、支持空间大、天然支持多目标定位(多人互动)。缺点在于便携性差、成本较高。大朋的Polaris激光定位技术采用经典的激光发射基站+激光接收器的传统模式,除了保有传统的激光定位技术的所有优点之外,最大的不同点在于他的激光基站“很大只”,是一长条的,比vive大不少,每台基站里面有3个发射单元,比vive的2个发射单元多了50%,并且一长条的基站扩大了发射单元的间距。发射单元数量的增加以及发射单元间距变大,意味着激光接收器的数量可相应减少,解算空间定位的时候仍能得到相同数量的方程组,于是就能达到和Vive一样的定位效果。优点在于降低了头盔的重量,减少了对脸部的压迫感。缺点在于基站的安置更为复杂(因为基站变大变重了)。