南宁鼠标价格社区

国元证券2016年策略会 - VR专场会议纪要(上)

只看楼主 收藏 回复
  • - -
楼主

国元新兴产业专题研究人机交互遇上VR(胡德全)

各位领导、嘉宾,大家下午好。我是国元证券研究中心的TMT研究员胡德全。今天下午,我代表我们国元新兴产业研究小组,为大家汇报一下我们在人机交互和虚拟现实、增强现实领域所获得的一些研究心得和成果。希望我们的报告能为各位嘉宾在相关行业的投资决策中起到些许帮助。当然,今天台下与会的有许多vr/ar行业的大佬和专业人士。如果我们的报告在任何地方有不足,或者需要更正的地方,也请大家拨冗告知。

人机交互,其实是通过输入设备和输出设备以有效的方式实现人与机器间信息交互的技术。人机交互的方式和功能是决定相应系统友好性的一个重要因素。随着技术发展,操作命令越来越复杂,对人机交互功能的要求也越来越高。

早期的人机交互可能可以追溯到打字机,而体感交互的良好体验也成交了Kinect和wii。

我们可以发现,人机交互的发展史,是伴随着整个平台、软件、和产品的发展。可是,pc束缚了身体,手机束缚了手和眼睛。我们显然是需要一种更自然,可连续的新一代交互方式来满足我们对交互体验越来越高的要求。

那么下一代交互方式会不会是表中之一?然而现下在研发的每种新交互方式几乎都有其不可回避的局限。因此,可以完全满足我们对自然、连续、真实的交互需求的交互方式,很有可能是一种各取所长的多模式交互。当然,这也意味着需要有一个新的交互媒介作为载体。我们认为,vr/ar很有可能就是这个媒介。Vr/ar设备其实并不是一个全新的概念,googleglass早在12年4月就已经发布。而vr/ar相关的概念和想象可以在许多科幻作品中找到踪迹。很多的新交互方式在许多消费级产品中已经有了应用。许多公司也进行了相应的技术积累和商业化尝试,这些积累为vr/ar的设备开发、应用,铺平了道路。

这是一些巨头在vr/ar领域的投资和设备开发。我们可以发现,包括微软,Facebook,sony和htc都将在明年上半年发布自己的vr产品。所以这个时间节点可能会在二级市场投资决策中显得相当重要。我们将vr/ar产业链大致分为上游硬件、产品;中游平台、软件;下游内容、应用三部分。这是vr/ar产业链中的国际供应商。这是我们收集的国内的vr/ar产业链的供应商。Vr眼镜如果进行拆解的话,大致可以包括以上几个部分。

从硬件角度来说,vr眼镜仍然没有出现头一的标准。我们认为这种状态会在明年,几个重量级产品发布后解决。 而vr的应用场景十分丰富,我们会在之后的ppt里展开。Ar除了googleglass以外,仍然没有可供参考的商业化产品进行分解参考。但我们能从上图hololens的猜想里管中窥豹。

Ar从硬件角度讲,远未达到商业化的程度。许多关键零部件的技术路径甚至都没有确定。例如处理芯片、电池等关键技术的突破将是消费及产品出现的关键。Ar的应用绝对让人脑洞大开,通信功能与各种商业化应用结合起来以后,便携可穿戴的ar眼镜绝对有代替智能手机的潜力。Ar产品现在还在开发者版本的阶段。目前的增强现实,主要以ar图片的形式应用于教育、广告等行业。

接下来,向大家汇报一下我们对vr/ar行业的逻辑梳理。我们从上游硬件、产品;中游平台软件;下游内容应用,三个维度来梳理行业发展的逻辑。因为我们觉得产业链上中下游在产业链中是相互作用的,很难在同一时间轴中进行拆解。举个例子,iphone、itunes、和app,到底是谁成就了谁?这其实是个鸡生蛋蛋生鸡的问题。因此,接下来我们会从以上三个维度,以及产业发展加速的触发点,两个角度来进行行业发展逻辑的梳理。

首先,从硬件角度讲,vr硬件几乎已经不存在特别大的技术缺陷。而ar硬件仍然革命尚未成功。但我们可以从图中欣喜地看到,处理器运算能力的上升和功耗的下降从未停歇,很可能在不久的将来达到我们对可穿戴ar的硬件要求。另外,统一的硬件方案将是产业快速发展的前提。我们预测,vr的硬件解决方案在2017年左右将会逐渐趋合;ar在2022年前基本解决硬件问题。

从软件、平台的维度来说,我们可以看到:微软、google、苹果的重量级软件产品的推出都先于其硬件载体的爆发。而且,上述两者也是三个公司股价走牛的重要因素之一。从统治级平台出现的时间规律来说,我们认为十到十五年是个重要的区间,2020到2025年很有可能在vr/ar这种全新交互模式下出现另一个统治级的系统平台。而系统平台的统一是产品标准化的必经之路,也是软件生态丰富的基础。

从下游应用的角度来讲,vr和ar有所不同。Vr是现实转虚拟的过程,适合封闭环境;ar是虚转实,适合便携、可穿戴。我们认为vr将先从c端兴起,再走向b端更物联网的产业应用。这其实类似于互联网的发展路径:先是消费级互联网、再是产业互联网。 而ar将更多的从b端开始试水,生态丰富后才逐渐由替代手机的能力。

具体来说,vr再上图所有的行业都能产生消费及应用。甚至在未来,vr将会对其中某些行业的生态进行重构。比如教育,目前教育资源相当缺乏,而互联网的教育应用,比如“班班通”、k12在线教育的体验并不完美。但vr对教师资源的共享、教育素材的应用等方面完全有能力解决上述问题。另外,在社交、会议、建模等方面,vr也提供了更好的交互方式。甚至最近airbnb的房产共享也引入了vr看房。因此,vr在行业应用中的想象空间十分巨大。目前,vr体验店发展很快。国内已经有许多公司利用这种模式进行商业化运营。在这之后,我们相信内容的兴起将是vr的行业发展重点。Ar仍然处于起步成长期,目前B端应用更有可能是生态结构的试水。消费及应用仍有一段路要走。

综上所述,我们花时间画了这样一个图。图中的节点为行业发展加速的触发点,以及相对应的时间和出货量的预测。 总的来讲,vr短期看硬件和平台标准的统一;中期看行业深度应用对生态的丰富;远期看对下游行业的重构。 Ar短期看硬件路径;中期看生态构建;远期看对智能手机的替代。 我们认为vr和ar最终将会融合统一,构成mr,即混合现实。

我们vr/ar的投资逻辑也是基于行业发展节奏来梳理的。2015年至2016年,我们推荐大家关注商业运营vr /ar体验店的标的。此时产品在需求导入期,现象级产品尚不成形,平台和生态系统不统一,使得vr/ar体验在这个时间阶段有消费需求。而小型体验点在每次5-20分钟,20-50元一次的标准下,单台设备的体验年营收能力超过100万。另外,体验点还可以作为内容分发的渠道,以及应用的试炼场。无形中又增加了其商业价值。

2016-2017年,现象级产品出现后,平台和硬件标准逐渐统一,内容分发成本降低,此时应当关注内容和应用提供商,以及软件和交互技术的供应商。当然,内容方面有IP的,交互技术不挑终端的厂商的生命力可能会更强。 远期,在ar硬件路径逐渐清晰,甚至有能力替代智能手机的时候,推荐大家关注相关的硬件供应商,此时,vr/ar的出货量已经达到了很大的数量级。有相关技术储备的公司值得关注,它们甚至还有硬件零部件国产替代的潜力。这是歌尔声学和莱宝高科进入苹果产业链后的股价表现。Vr/ar国内相关的投资标的我们进行了简单的梳理。这是我们梳理后的表格。这是投资标的的推荐,时间的关系,暂时就不展开了。需要强调的是,我们认为vr/ar不会是一个昙花一现的概念,相关产业的投资机会将长期存在,未来我们会结合产业发展逻辑,连续追踪相关标的,然后将我们的研究成果实时跟大家分享。

我的分享就到这里,对我们报告内容有兴趣的平又可以问我或我们同事索取ppt。抛砖引玉,微软无疑实在vr/ar领域的科技巨头,拥有多项虚拟现实方面重要的人机交互前沿技术,比如语音交互技术的小娜、手势识别的kinect等等,而明年即将要发布的ar重磅产品hololens也让大家万分期待。接下来,我们欢迎微软的技术专家梅颖广梅老师带来人机交互方面的主题演讲,大家欢迎。

微软技术专家(梅颖广)

首先很感谢主办方举办的这个活动,邀请了这么多嘉宾。那么今天我也将我们微软的产品带到了现场,不知道大家平时有没有接触过。(介绍了一下产品)大家可以看到微软的产品有cortana、Windows hello等,今天我们主要是介绍一下我们的Kinect。

首先我们来看一下Kinect的数据来源,下面列举一下Kinect在同一个场景下捕捉到的不同画面。我们看第一张图,是一张1080p的高清图像。第二张是在红外光下形成的图像。第三张是关于深度数据的,从这张图里我们可以看出物体离我们的距离到底有多远。第四张图里,Kinect将不同的物体用不同的ID和颜色标志了出来。第五张图是将人体的结构用线条来表示。第六张图可以显示出不同物体的声波来源。

那么在人体构造上面,我们用25个点并用线条串连起来表示。我们来看一下手部结构,整个手掌我们用三个点以及两个线段来表示,这样的话我们就可以识别类似于拳头或者把手掌张开这样的手势。

SDK里面的Face APIs主要能进行二维人脸模型构造,我们用五个点来表示人脸。通过这个可以进行头部定位,还可以表达一些眼睛是否睁开、是否看着传感器等信息。

运用Kinect fusion还可以进行真实场景的三围几何重构,并且能够生成三围几何模型。对比手工3d建模,能够非常快速完成建模,极大提高了生产效率。那么接下来这张PPT主要是说明人脸模型的3D构造,从图中也可以看出来。

在整个运行过程中会调用微软beta11的渲染技术,所以我们要去开发或者使用的话,最主要是有一个完全支持它的型材。除此之外,由于它里面有不少3G方面的处理,所以我们对机器的要求稍微高一些,主要给大家推荐i7的CPU和至少4G的内存。然后关于USB,个人感觉主要是用3.0结合的USB就可以了,2.0的数据量太小了,传输数据太慢,因为它对传输速度要求还是很高的。然后操作系统的话不管是开发也好,使用也好,至少需要windows8的系统。

那我们现在看的这张图是想告诉大家我们Kinect的整个开发已经在世界上比较有名,也已经与一些比较流行的第三方的中间件有了非常好的合作,彼此是一个结合的关系。大家可能比较了解Unity这个产品对吧?那么在3D这个产品上面我们也有专门的package,只要你安装了以后,你就可以非常方便的去开发这个软件。

然后呢,整个SDK的软件开发工具包里面也有两个非常强大的工具,一个我们称作Kinect studio。这个工具是干嘛的?刚才给大家看了,你要做开发的话,一个必要条件就是要有一台设备,那么这个设备重其实也不是太重,但是毕竟你得带在身边,所以可能会给开发带来一些麻烦。为了解决这个问题,我们有一款叫studio的软件,它允许我们把获取的颜色、声音等图中列示的这六类数据非常方便的去保存,去标识,去管理,最后我们也可以用来播放,如果有这个工具大家就会非常方便。我们可以通过传感器去捕获六类数据源,然后把它保存在studio里面,有了这个即使我改变了我的开发环境也会非常方便。我只需要打开studio把刚才我们录制的信息播放一遍,就可以进行调试开发了。所以这就可以让我们不用把设备天天带在身边了。

当然给大家一个提醒,因为数据量的关系,你要使用这个功能的话一定要注意你的硬盘空间。因为该功能需要不少的空间,特别是全高清色彩的信息,大概一秒钟的话需要120兆的空间。

最后给大家介绍一下这个叫手势识别的工具,这个工具也是非常强大的。大家知道我刚才说了,我们可以识别人体的动作、结构,并且人体的结构是由25个点来组成的。但是我们刚才说我只是知道这25个点的位置,并没有说能够知道他做了哪些动作。所以如果我们要知道这个动作的话,理论上需要程序来判断这个位置,这会给我们的开发带来一定的麻烦。为此我们有这样一个手势识别的工具,你可以把你认为对的动作,通过刚才所说的studio的工具保存起来,并导入到工具里面去,然后使用一些非常强大的算法,就可以知道你做的这个动作就是你定义的动作。之后它便会导出一个知识库。我们在普通应用里面把这个知识库导进来以后,如果使用者再做这样的动作,那么我们的程序就会知道你确实做了这样一个动作。所以这个对我们的开发来说是非常的方便。包括我刚才所说的一个自然交互应该有的动作,我们也可以通过软件去修改这样的动作

这张PPT里主要是Kinect学习或开发的一些资料,大家可以看到我们的硬件设备很强大,后边提供的SDK软件也有强大的功能,所以对Kinect来说到目前为止所使用的场景也是非常丰富的。我也希望在坐的各位能够自己想一想我们怎么样更好的使用Kinect,并用到各自的业务当中去。

我们主要给大家罗列几个Kinect使用的场景。第一个就是在零售业,可以用在虚拟的试衣镜上面,稍后给大家放一段两分钟左右的录像向大家介绍一下。第二个比如说制造业,可以用在一些市调内的机器人,通过Kinect来矫正我们做的动作是不是标准。第三就是医疗,因为医生有大量工作是不适合用手去摸鼠标,用手做触控操作的。那么我们就可以提供这样一种非金属式自然交互的方法,能够帮助医生做一些这样的操作和交互。然后对于康复类病人来说,同样可以用来矫正康复类病人康复的动作是不是到位。对于娱乐业来说,除了游戏机给大家提供体感游戏以外,一些交互类并且需要大家接触的电影、媒体,就非常适合使用Kinect。最后在教育和培训业,对于动作类的培训或者对非接触类教育培训来说Kinect也是非常有用的设备

那么最后给大家放一段录像,然后我今天报告就到此结束。看这个录像的时候大家可以看看用了多少我刚才所讲到的技术。(视频)

i机器人创始人(朱频频)

大家好,今天有幸在这里做个分享,今天整个话题讲的是AR和VR,我们其实做AI,也就是人工智能。这个AI和VR/AR就是是何关系?前段时间我跟一个国外著名分析机构分析师在一起沟通,他跟我们说,说你们要特别注意一下VR,以及整个VR产业的发展。我说VR的确现在非常火,它跟我们有什么样关系呢?他说人机交互跟VR是一种天然的结合,他说VR会最先应用在什么地方呢?他说你猜,VR最先会用在什么地方,什么地方会产生直接商业价值,这就像整个互联网发展一样,整个互联网里最早有盈利模式的是哪个行业,那么VR里边那个行业的商业应用的可能性就最大。接下来就开始我今天的分享。

我今天分享主要的主题是智能交互,我这里没有牵扯到说AR相关的内容,我就是把人工智能和智能交互方面一些理念和对行业的认识和我们做的工作给大家做一个分享。

前几年大家经常会提到云计算、大数据,从去年下半年开始,人工智能是一个非常热的话题,同时机器人也是被大家不断提起,其实从某种角度来说机器人是人工智能技术的一种综合体现。之前,在人工智能这个领域,全球各大公司都投入了非常多的资源包括谷歌,在2013年底的时候就投了大概有十家的机器人和AI的相关公司。Face book很早做了这种布局,并分享了很多Face book在人工智能方面一些工作;最近谷歌也是开元它深度学习的一个项目。

很多时候,我们在谈到我们谈到机械人的时候,可能第一印象就是动画片,很多电影里边看到未来的机器人或者想象当中的机器人,这个大白更加有名,是著名的暖男。但是除了人型机器人之外,还有一些机器人不一定非常有人形。这款机器人大家见过吗?可能见过,有人见过不一定记得起来,这一款是去年,去年年底的时候有电影叫做《星际穿越》。《星际穿越》里面有这款机器人,这款机器人是我最喜欢的机器人。虽然它不具备人形,但是它具备人基本核心的智能,它可以跟你去交互,它可以跟你很幽默的交互,大家可以看到它最后设定的幽默指数,幽默指数设的非常高的时候,它说我要自爆了。

作为一款完整的机器人来说,它一般具有三个重要的要素,分别就是感觉、运动、思考,感觉运动和思考,这分别对应不同人工智能的方向。比如说在运动方面,有很多运动智能,我们看到平衡车里面用到运动智能,还有就是美国波斯顿公司所做的大狗还有驮驴,它可以驮着很多东西在沙垛上去走路,这里面需要用到很多运动制平的算法。在感觉方面,刚才微软的这位老师也提到了,就是耳朵怎么去听,眼睛怎么去看,以及其他的一些感知。这个地方就是在感觉层面,我们会用到很多感觉智能,诸如语音识别、图象识别、人脸识别,就属于感觉智能的一些范畴。当然最重要的作为机器人来说最重要就是思考的层面,它有一个大脑来思考,它可以理解很多的事情。

这里面几个名词正好可以跟大家分享一下,我们提到之前,可能现在我们在实际市场上有两类机器人,一类是工业机器人,一类是服务机器人,我们主要是服务机器人。工业机器人更多是在叫生产或者制造自动化层面。另外提到智能提前就是具备智能一种机器人,智能机器人不一定非要具有实体,也不一定要这种身体。所以它有虚拟的智能机器人,也有这种实体的智能机器人。最后一个提到认知智能,我刚才提到思考,思考里边非常重要就是在认知智能方面,人类之所以区别于动物,其实核心并不是在感觉智能方面,我们家一头小狗,一头小猫,它也具备感觉智能,因为它也可以识别人脸,因为它也可以识别我们,它也听懂声音。但是人类跟动物最大区别是什么?是我们对自然界有自己的认识,并且把这种认识已经凝结成知识传承下去。所以我们的小孩在学校里学习,学到很多这样一些知识,他有很多理解,但并不一定是他亲身经历过这样的事情。所以这是非常重要的理念,就是知识、尝试还有经验,是人类区别动物最大的特征。

最近经常有人说计算机的智能如果超越人类该怎么办?还引起了讨论和恐慌,从某种程度上来说,像计算智能,其实计算机早已超越人类了,这是毋庸置疑的。在感觉智能方面呢,尤其最近做的工作像图象识别方面,在某些窄的领域里边,计算机图象识别的能力已经跟人类非常接近了,或者在某些点已经超越人类了,那么在认知智能方面呢计算机要走的路还很远,还非常远。这也是我们所要重点做的工作。

刚提到智能机器人也分虚拟和实体的,这样一个分类我们是从国际著名的IT调研公司给出的一个分类。它可以把人工智能应用分成实体的和虚拟的,也从可见和不可见的角度,也就是说人是可以直接感受到,它只是后台软件在后台运行;我们感受不到的,这样分的话比如说实体的,我们能够感受到的是哪些呢?机器人、无人机、无人驾驶汽车是我们可以展开到实体的这部分,另外还有一些虚拟的,并没有具有实体,但是它也是人工智能的应用,比如说虚拟个人助手,虚拟个人助手智能顾问,它这里边用到很多就是一些对我们行业也好,对自然整个理解,并且能够进行交互。其他在后台的部分有很多,像微软推出的语音对语音的翻译,还有一些语音的转写,还有后台应用,比如智能家居系统。

下面,我举几个例子给大家看一下,刚才提到有VCA有VPA还有智能机器人,像VPA早期这种形式呢,除了云搜索之外,比较早期的形式就是聊天机器人。在2004年的时候,小i在msn上推出了一个聊天机器人,加了帐号以后你就可以像真人一样去聊天。中国最早的聊天机器人就是我们小i做的,最早出现在msn上面,后来也出现在QQ上面。我们当时就拿到了很多风投。之后,出现了很多创业团队做类似小i的东西,出现了诸如小a、小b、小强、小q的,等等,最近出现了一款聊天机器人很火,就是微软的小冰。

除了聊天机器人外,还有一个虚拟个人助手,也就是云助手。这个大家可能知道蛮多的,有谷歌的个人助手、百度助手、联想云助手、搜狗云助手,还有百度刚刚推出的度秘,这些通通都是云助手。未来的目标可能就是要给每个人专门的助理,处理关于自己很多事情,回答你很多内容。

刚才也提到有个叫VCA的虚拟客户助手,虚拟客户助手这种应用已经处于产业的前期了,已经有很多产业在应用,这种商业价值也非常明确,就是它可以替代很多客服中心的客服人员,客服中心每天不停地会回答重复性的问题,这些问题都可以用机器人替代掉,这种虚拟的、软的机器人替代掉他。机器人用了核心技术就是语音理解,用了核心技术就是知识管理,用了核心技术就是人机交互。这些客户的话,这些企业已经采用了这种智能客服助手。这是招商银行微信上的机器人。这个机器人不仅仅在微信上面,还在网站上面,还有微博、APP、掌上生活、热线等很多地方用。因为对他们来说机器人用的知识库是同样一个知识库,只不过用不同的交互方式在最终上面去做一个体现。所以它现在是一个全天候、全业务、全渠道、线上线下综合一体化这种服务过程。

我们小i的定位就是做智能机器人领域的中国第一的品牌,在很多地方我们都是有自己独特的优势。在国内行业地位呢,在智能客服方面我是占了90%以上,另外还有很多,同时资本方面我们也获得了一些资源,在上个星期12月17号,我们也是刚刚登陆新三板。这个是国际上对我们的评价,在很多领域我们已经做到了全球领先的水平,它说你至少可以排进全球前三位。

我们的发展战略方面呢,一方面就是从大到小的发展战略,也推出了自己一些云服务平台,除了这种大型企业之外,中小营企业也可以使用我们的服务。有时候我们推出政府自营是针对于电子商务的,也推出了硬件自营是针对于各种硬件的,他可以用智能硬件提供从智能交互、智能服务到智能营销全方位的服务。另一个就是从软到硬的战略,因为我们核心是做软件的,但现在也罢很多核心能力传递给我们的硬件。还有一个从内到外的战略,就是通过产业化的应用产生很多真实、大量的数据,通过我们的学习体系在不断连接各行各业的知识和语意,这些知识和语意有加速整个产业化进程的发展。

下面有幅图很有意思,跟大家分享一下。这里面预测,在2020年也就是五年之后,有40%的移动交互流量是来自于人和智能机器的交互,也就是来自于和这些虚拟机器的交互。这意味着什么?其实这个观点跟今天VR的话有点类似,就是它里面提到人机交互即将迎来后APP时代。也就是说咱们以后更多交互获取信息不是通过按钮,不是通过菜单,而是通过非常自然的交互方式。

七鑫易维COO(彭凡)

彭总:感谢主办方举办今天这个活动。尊敬的各位企业家,亲爱的各位朋友,大家下午好!我是七鑫易维的联合创始人彭凡,很荣幸有机会在此给大家分享眼球追踪这个技术。众所周知人机交互技术的变革一直改变着人类的生活,今天主办方实际上已经把我简单想说的观点都说了,就是从过去单一的人机交互到未来新一代的人机交互会是什么?我也认为是一种多模态的交互技术,这里面会有触摸,包括声控、眼控甚至还有脑电。

眼控在这里面会是一个什么地位呢?我认为人类获取信息90%的通道是通过视觉,就像我们每个人的五观一样,所以在视觉的信息当中,眼球追踪所能够提供给你的是一种叫做注视点的信息。而这个信息未来有多大的价值?我觉得可能很大,在当今我们还没有把它完全的开发出来

那我们简单介绍一下眼球追踪这个技术,其实是通过我们叫做传感器的东西来捕捉用户眼睛的图象,并试着计算出你实现的方式和你注视点的位置。大家可以看到这幅图就是一个传感器在捕捉一个用户的眼球图象。

我们公司一直专注于这个技术。从2009年成立到现在,我们其实一直是把这个技术放在医疗这个领域,是给残疾人所提供的沟通辅具,帮助他们用眼球来打字,来跟医生、跟家里人恢复沟通。因为很多残疾人他们丧失了沟通的能力,他们不能说话也不能动。

那我们去年因为参加了一些活动,所以拿到了一些荣誉吧。这是我们团队的简单介绍,创始人黄通兵先生是从军工领域出来的,这个技术来源其实跟军工有一点关系。因为在战斗机设计当中,传统的战斗机瞄准技术是通过投动所地去瞄准敌机的。现在随着战斗机的性能越来越提高,传统的投动所地已经不太好用了,那么目前英国的皇家空军正在研究如何用眼球去锁定敌机。那中国跟美国呢在这个领域也正在研究,我们的创始人当初也是觉得这个技术的前景非常不错,能不能把它民用化,所以在2008年就申请相关的专利,2009年注册公司,在这个公司进行一个尝试。

所以一直到现在为止,我们公司成立的时间蛮久的,接触的积累时间也蛮久的。那目前在国内虽然我们是唯一的一家,但是在全球看来的话呢,这个技术其实还是有几家竞争对手的。那传统这种眼球追踪的问题会用多传感器的方案,这样的话呢它相对来说硬件上比较复杂,但是算法上会相对简单。那我们公司是用单传感器的追踪技术,所以我们的硬件成本非常低。同时目前我们的追踪精度已经达到国际一流水平,为0.5到0.7度同时用单传感器来实现用户的自由投动也是非常难的,因为目前在全球其他公司来看如何用单传感器适应大范围的投动是很难的问题。

这是我们跟目前全球最厉害并且算是最知名的一家公司的技术对比,这家公司今年4月份刚刚在纳斯达克上市。我们因为是技术型公司,所以非常重视知识产权。有一个小故事是我们去年和高通投资,当时我们给高通的沈总看了我们技术demo。第二天沈总跟我说你把你们知识产权的列表和详细的介绍发过来,高通要审核。后来呢高通是通过它国际法务部的律师逐条逐条跟我们核对,我们的专利在全球范围内的保护范围和优先性。最后呢,高通是非常认可我们整个保护的范围和我们的创新性。大家知道高通在全球是以专利著称,所以我们这一块应该说在国内绝对是非常好的。

眼球追踪这个技术其实可以用的领域非常多,我这里面所列举的其实是我们公司未来主要做四个大的领域,那其实还有像教育,像航空、航天这些可能是我们暂时没有考虑的。那我们现在已经推的产品有全能眼系列产品,这个是主要在医疗这个领域,就是帮助像渐冻人这样的患者,用头用眼睛去完成沟通,去打字。图中是我们的头控仪,这是我们双目的眼控仪,包括我们的单目。这三个产品其实是针对残疾人在不同患病期间用的不同产品,根据他病情的严重程度不同来划分的。

这是我们很多患者案例的照片,我们在10月底,这个技术,,并在辅具产业大会全球第一届大会上来代表中国展示,因为在场当时全部都是跨国公司,有做假肢的,做助听器的。然后用户用了我们的眼控仪,已经出版了三本书了。在这个行业里面我们每天都在感受各种各样人生的奇迹,这些人他们用他们坚定的意志在绽放。

这是我们一些简单的市场现状,我们目前已经做到国内整个行业的老大,刚刚说到最大的竞争对手,那家在美国纳斯达克上市的Tobii公司今年已经把它的中文网站关掉了,因为在中国这个辅具的市场做不赢我们。当然我们还有跟依云(音)合作。原来我们渠道很窄,目前我们跟协和,跟各大知名的医院开始合作,大家可能会在以后医院的住院部,或者是ICU病房里面看到有七鑫易维提供的眼控仪,眼控沟通辅具,帮助在ICU病房的患者他们恢复沟通,跟医院、跟医生有简单的交流。

现在我们在做一款叫做AC眼控仪的产品,是全球首消费级的眼控仪。它可以拿来做眼控的游戏,现场如果有游戏的开发者之后可以跟我们分析,我可以给你们提供。眼控还有空战类的游戏,这个也是非常有意思的。还有就是眼动分析,这个是很传统的领域,就是告诉你消费者如何思考一幅广告的。比如说大家可以看到这个案例,左右这两幅图你们发现有什么区别了吗?实际上是两个模特他们的延伸区别,左边这幅图模特眼神看着产品的,右边这幅图模特的眼神看着你的。那仅仅一个非常微小的区别,但在广告领域来说左边广告是非常成功的广告,它会引导用户的注视,注视到产品和注视到slogan。而右边这幅广告是一个非常非常失败的广告,因为所有人的注视都看到了美女的脸。

如何去发现这个问题呢?需要做眼球追踪,眼部分析。在国际知名的4A公司都有一个实验室叫做眼动实验室,里面就会做这个分析。目前我们也在跟相关的公司合作,所以我们会提供一个平台的SDK,开发者可以拿我们的设备做他感兴趣的相关内容的开发。

那接下来说的大家可能更感兴趣一点,就是consumer的市场:智能手机和穿戴式提供眼球追踪。这里面会有一个简单的图告诉大家怎么样在智能手机上实现眼球追踪的功能。我们目前已经在跟国内非常知名的手机公司合作,也许大家在明年二季度就能看到第一款有眼球追踪的旗舰手机面市。同时我们也在和其他几家手机厂商谈合作,所以我相信眼球追踪的手机会是明年很热点的主题。

大家可能会说眼球追踪拿来干嘛?在手机上可以实现眼动对焦拍照,因为传统的拍照需要你一只手去点焦点,另一只手可能去点拍照的按键,所以还是没有办法很好实现单手拍照。同时的话呢大屏手机用眼动可以来做基于眼球追踪的裸眼3D技术,还有就是传统的一些比说眼动的翻译、眼控的游戏等等。

那今天这个主题是VR和AR,所以我也很坚信的认为穿戴式的智能眼镜会成为手机后的另一个全世界的智能终端。现在其实大家没提到一个问题:VR的晕眩问题,这其实是这个产业目前最大的问题,也是我们圈内作为技术型公司被大家经常拷问的一个问题。VR的晕眩也有什么原因呢?我个人认为有三点,第一点就是你身体的运动和你在VR视野里面看到的身体运动是不匹配的,举一个例子大家玩VR的过山车游戏,在过山车游戏里面你们的视觉体验是一个高度运动,但是你的前行系统告诉你你并没有运动,因为你坐在椅子上,所以这样会导致头晕。

第二个原因就是你头部的运动跟你在视野里面的头部运动是不匹配的。很多公司现在在强调一个叫20毫秒的概念,什么是20毫秒?简单的说不管你是用光线投入仪,还是用光学的系统,你采集到用户头动的速度、角度、距离,加上计算机渲染的时间,再加上显示系统显示的时间,不能超过20毫秒,一旦超过20毫秒用户的晕眩感就会很强,这是每个人的生理特性所决定的。所以现在做VR的公司都在强调自己能够控制在20毫秒以内,但是实际上人的头部在运动的过程当中,人的眼睛也是在运动的,没有哪个人说光头动眼睛不动。

所以人眼有一个特点,就是它会保留上一帧的画面和这一帧的画面,所以在运动过程当中你看到的画面会有托尾的现象,这也是人眼的生理特性。你要让这个生理特性在现实的过程中感受不出来,一个很简单、很粗暴的方法就是提高刷新率。所以大家会看到今天HTC宣布自己的刷新率是90赫兹,而索尼VR宣称自己的刷新率是120赫兹,但是对不起,我们经过了解分析,120赫兹可能也解决不了这个问题,可能要到200赫兹,甚至到1000赫兹才能解决问题。但是显然目前显示的技术没有办法达到1000赫兹刷新率。

第三个问题就是我们常说的,叫做VEC现象,也叫做视轴调焦冲突,这个是我们每个人的生理反应,就是我们大家去电影院看3D电影,有些人看3D电影会头晕,这个原因其实就是因为VEC现象。要解决这个VEC现象其实也有办法,目前英美达(音)的黄老板,他在做的光场显示器(音)就可以解决这个问题。但是这里面还有很多技术的路要去走。

所以我个人分析的话呢有三大点原因造成VR的晕眩。其中,通过眼球追踪这个技术能够判断用户的注视点,调节整个视觉冲突的过程,而且关键的问题是仅渲染眼球追踪部分的画面,我们叫做局部渲染。画面去主动适应注视点的位置,这样子既保持了真实感,也不会因为眼睛去适应那个注视点产生疲劳。

在局部渲染的过程当中,自然而然降低了GPO的负载,所以眼球追踪在目前行业内全球最顶级的技术团队公司来看,是AR和VR最为关键的一项技术,它可以带来更好的交互技术,更好的交互界面,能以人眼的真实对角移动渲染,还有画面的矫正。

所以我们公司会在2016年下半年正式推出三大板块,第一个模块是眼球追踪模主,我们正提供眼球追踪模主的方案,预计2016年下半年会出来。因为我们也在跟全球最出名的传感器公司合作,我们会提供眼控的OS,这样一套系统的话呢,能够帮助整个用户体验效率更高,加流畅。

那第三部分我们会提供眼动的移动渲染以及图像的修整系统,这对VR来说也是非常非常重要的技术。所以我们公司也是非常重视VR的技术前景,相信到时候大家可以看到

的分享即将结束,最后给大家带来一段视频,视频里面会有眼球追踪技术在未来人类生活当中一天会产生的各种各样的场景,谢谢!(视频)。最后我再补充一句,今天我带了一台眼控仪器,所以大家可以在外面体验到眼镜技术。

Like Show创始人(冯伟)

我们公司主要是做手势和动作感应的,下面我着重介绍一下手势控制未来在VR/AR里面所处在的一个地位。首先,我将举个例子:去年CES上面,Intel总裁在他做演讲时,问台下记者们一个话题,他问大家觉得现在最好的交互方式是什么?那很多记者讲就是iPhone,是触摸屏,这是大家最好的控制方式。但是Intel总裁跟他们讲,我觉得并不是。譬如说我跟你们交流的时候,我不是来点你,而是通过语音、手势、眼神、表情来和你们进行交互。 在这个例子当中提到的语音、手势、眼神、表情等等,将会是未来最好人机交互的方式。

我们公司叫微鲸科技,LikeShow是商标,是微软创投下面的一家公司,专注于人机交互这种3D手势技术,成立于2010年。大家知道,手势控制已经出来有一段时间,我们也已经技术应用到很多不同的领域,今天主要向大家介绍两个方向。

首先就是广告:对于这一领域,我们目前专注于户外广告,今天有很多上海的嘉宾,大家在地铁站、正大广场、静安寺等等,都能够已经看到很多这种跟大屏互动的广告,里面有80%是我们公司做的。其中就是用3D的互动手势来操控这个广告,我们主要有三个产品,第一个就是通过3D手势跟广告产生交互。第二个就是多屏,因为现在手机是密不可分的智能设备,通过手机和大屏产生互动。第三个就是大数据,漆面所有的产品发布以后就会产生数据,我们搜集比较多户外广告的数据进行检测。下面举几个例子:有一个案例,是我们在欢乐谷的一个大屏,因为可能我们今天的来宾可能很多还不知道这个技术,大家可以看一下实际的现场用户体验。在他面前是一个很大的LED屏,他走道面前以后通过简单手势可以控制这个LED屏,在这个案例里面它是看广告,看视频,通过收拾操控一些界面的操作,相对比较简单。

还有一个案例,来自我们的广告组,是肯德基在2014年世界杯活动,我们帮它做全国的巡回。主要是采用我们的滤焦墨镜,来推广它新产品。后面还有很多案例,基本都差不多。

其次,就是健身,甚至在医疗、幼教等方面也有很好的应用。针对健身,我们举个例子:这是周杰伦的私教,我们可以根据他的动作进行锻炼,根据动作获得打分,并且计算出你整体消耗的卡路里等等。这些数据和你的动作相关,并且和老师的课程进行对比,并据此产生评价和报表,有了这个体系,我们就可以在家里来完成整套健身课程,并可以通过社交网络进行分享,并且通过平台可以和教练进行交互。

各位朋友如果有兴趣的话也可以关注我们的公司,关注我们的产品,我们可能预计在明年年初,我们会推出我们的产品,定价非常便宜,超过大家的预期,大家可能去健身房,平均现在上海健身卡不管是私教的,还是健身房的,至少五千块钱十节课。我们一年的服务费,一年定价可能在一千五左右,你可以享受到所有教练一年的私教服务。

谢谢大家!

乐相科技 CTO (吕铁汉)

今天我们主要谈一下虚拟现实,以及我们对此的一些看法,最后再对我们公司做一些介绍。首先是虚拟现实,现在可能就是说虚拟现实大家会体验,然后我们外面也会有相应的设备,比较简单的是就是虚拟现实其实是直接接管的视觉系统,就是说你眼睛看到的感觉,就相当于你自己这个人是进入一个全新的世界。所以就是感觉自己穿越一个新的世界这么一种感觉,这个就有了想象空间,下面我们来看一看对于不同行业应用的情况。

室内设计。传统上我们要展示室内设计的话一种方式是我们在电脑上显示大家看,这个可能没有真实的感觉,比如说物体的比例什么,这个光凭眼睛很难感觉。还有可能就是说我们要有一样板间把它给装饰出来,然后人进去先看真实的场景,但是有虚拟现实这个技术以后,就是所有想体验的人,只要戴上虚拟现实的头盔,那么他就感觉他就相当于身处样板间里面,就能看到所有想展示给客户的效果。这个制作成本还是从对用户的便利性都会有显著的改善。

房地产服务。这跟前面这个情况差不多,未来在采用了虚拟现实技术后,我们实际上不需要去真正的样本间,在一个房子造好之前,房地产商完全可以用数据创造出一个虚拟的样板间,人在里面的活动和客户在虚拟现实空间的活动,和他实际到样本间的体验几乎能做到完全一样。

旅游。这个方面,也存在类似的情况。比如我们可以用虚拟现实技术的无人机拍摄这样一个场景,跟用户实际上坐在直升飞机去现场,看到的情况其实可以做到一模一样。但现在可能说分辨这些稍微有些区别。当这些方面得到弥补以后,其实聪人的视觉来说,我们完全可以做到跟你在现场看到完全一样的感觉。(我们对VR的看法)当然还包括像教育、游戏、医疗这些产业其实是一样的,因为对于人来说主要信息接收渠道就是视觉,排第二位是听觉,后面是触觉这一类的。那么在虚拟现实这个技术里面,因为视觉我们其实可以百分之百的模拟现场的情况,然后听觉其实以前立体声的技术,包括后来环绕立体声的技术也可以解决听觉问题。那么对于人来说人机交互这个地方接受信息量最大的渠道其实通过虚拟现实技术都是可以完整模拟出来的。所以就是说在现实这个世界中,我们现有活动中所有不需要具体身体接触的,这一类的活动完全都可以通过虚拟现实,所以因此这个行业就是说将来这个想象空间其实是非常巨大的。

最后我将会介绍一下我们公司自己产品的情况。我们目前在市面上至今已经提供的产品主要有两类,这个也是整个业界主要提供的两类产品,一类是叫做手机盒子,我们叫做大朋魔镜,因为这个是虚拟现实一个眼镜盒子,然后要把手机放进去人来看,用户用这个主要看3D的视频比较多。还有一个就是我们称为PC端系列的大朋头盔,这个是通过连接PC端的,这个我们在第三方评价中是最接近当前业界领袖体验的设备,还有延时,大视场这些方面我们的指标应该都是全国领先的。

这里我稍微谈一下我们的大朋头盔。第一个是说因为在系统优化,还有在显示期间上的选择都是使用了当前市场上能够拿到最优体验的器件和算法,所以我们基本上能够保证就是说没有眩晕感,这里没有眩晕感基本上指如果你人是在原地坐着,你只是进行转头活动的场景下,使用二十分钟、三十分钟没有问题。这个当然也是跟我们系统里面有相应的优化,保证头盔的传感器拿到数据以后,能够及时更新到屏幕。另外我们的屏幕采用的是OLED的屏,它在延迟时间上面对比普通市面上常见的TFT屏有比较明显的优势。然后还有就是大视场。一个人确实是进入虚拟的世界,我们要保证人整个眼睛看的场景里面其实都是受到虚拟现实系统控制的。否则的话比如说我们只造70度角的可视场,那么实际上只会有一个你在电影院里面看视频的感觉,这个其实就没有真正起到虚拟现实世界的作用。对此我们有120度的可视场,所以保证戴上去以后完全有全程性感觉,等一会大家有空的话,可以去体验一下我们的设备。

下面介绍一下我们移动端的这个产品。这个是属于相对早期的产品,这个里面并不需要有复杂的运算器件,也没有特别的算法,主要是解决了一个便携性的问题,能使用户在普通的环境里面观看3D视频。那么我们在这个里面主要是考虑了我们有特殊光学技术,是可以看起来比较舒服,我们还有相配套的软件,后面我们会介绍。

前面提到的第一个产品,就是大朋头盔,体验应该说在国内供应商里面是最好的,所以市场占有率是超过50%的,大家在商场看到体验店里面应该用我们这个比例是非常之高的。第二个就是大朋魔镜,整体体验虽然还不错,但由于定价的原因,比暴风魔镜的销量会略低一些。另外,我们实际上还拥有3D视频这个方面国内最大的平台,我们现在用户量已经超过一百万,峰值的时候是超过4万/天的用户量。

刚才主要介绍了我们的产品,下面着重介绍一下相应的内容。在虚拟现实这个行业,现在属于刚刚兴起的阶段,虽然开始主要是硬件设备商是这个行业的推动主力,但若没有相应内容的话,这个行业发展会受到一些限制。目前来说,实际用户数量没有那么多,相应内容提供商就比较少,为了解决这方面的问题,我们也跟业界进行一些合作,比如说最近刚举办了百万招募中国VR游戏大赛,这个游戏大赛,我们在这个里面跟多个开发团队以及主办团队相合作,获得了一些很好的游戏,等过几个月我们可能就可以在我们的平台里面向大家推广。

再有就是移动端的平台,目前移动端主要还是面向视频的。所有我们在视频方面有一个软件叫3D播播,这个应该在整个市场中占有率非常高的播放软件,然后我们在今年9月份的时候举办了360度环视视频的大赛,也获得了一些很好的视频的内容。另外我们在跟版权方有一些合作,比如说我们跟我们的投资方有一些合作,现在国内数量最多的正版版权3D信息,通过3D播播平台都可以直接访问到。

所以我们整个内容平台里边,我们正在逐步和大家合作推进。今天我要介绍的基本就是这些,谢谢大家!

亮风台 创始人(廖春元)

我们公司是2012年11月份在上海张江正式成立,现在在美国和北京均有研发中心,在今年(2015)初我们完成了A轮融资,前不久刚刚完成了一个A+的融资。我本人,在1996年的时候,大学三年级第一次进实验室的时候刚好是清华计算机系人机交互研究所。我觉得还是运气比较好,当时就觉得很好玩,未必想到现在有多大的用处。但是在之后一直在这条路上走了很久,我觉得能够看得出越来越多的人,用户在注重人机交互,我觉得跟整个行业的发展和生活水平的提高有大的关键之处,这是大势所趋。

首先,我要简单讲一讲AR和VR,很多人对这个分的不是很清楚。简单来看,AR就是在这里专门有个摄像头,对真实世界进行采集,然后就是3D环境的重构,必须用到计算机识别和人工智能的东西,需要让计算机知道你现在摄像头里面看到了什么东西,空间中的位置,3D的定位和跟踪,最后要重现这个模型。在这个基础上,把现实跟我们重构出来的模型融合在一起,最后用视频融合的方法呈现出来。所以跟VR很大的一个区别是在下面这一块,让计算机理解完整的步骤,这个是非常重要,也是难点之所在。

其次,我们来探讨一下AR的应用,对于这个方面有很多不同的看法,我觉得核心一点是解决咱们线上线下信息不对称的问题。今天在场有不少包括教育还有包括医疗的朋友,举例来说对小孩教育,我们并不希望小孩天天抱着一个屏幕,这对眼睛不好,它需要一个实体的环境,但与此同时他损失了一个与数字的交互。刚好AR能够把虚拟和现实结合在一起,把实体和虚拟交互融合在一起,这是一个比较好的切入点。另外一方面包括医疗,远程医疗、诊断和做手术其实都有很广阔的应用。在此应用下,怎么让计算机找到这个场景下的相关信息进行交互,这一点我觉得是核心。

为什么要重视AR。简单来讲,一个是从人机交互这个维度来看,为什么AR具有重要的意义。咱们其实看看计算机发展的三个阶段,每一个阶段都成就了一家独大,在PC时代成就了微软,与虚拟的桌面,用鼠标和键盘去操作虚拟的桌面,在移动互联网时代苹果还有iTunes进行交互去操作移动设备上虚拟的桌面。咱们沿着这个领域的轨迹往前,它的趋势变的越来越自然,越来越接近,人和人最自然的交互方式,下一个姿势是什么呢?我觉得很有可能是AR,通过视觉的方法,让人直接操作真实世界,不需要操作虚拟的世界,这是一个趋势。另外一个维度,可穿戴计算的角度来看,大家知道可穿戴计算其实是人为核心的计算,既然是以人为核心的,我问一下大家人获得信息最主要来源是什么?肯定是视觉是吧?70%以上是视觉,所以说可穿戴计算中心是视觉的交互,而视觉的交互在这一点显然我觉得是AR的交互。

另外一点其实我觉得很重要一点就是说AR跟实体相结合,它的渗透度可能更高。大家看到比如说各种移动的办公,教育的培训,包括购物、设计等等。这些都是能够看出AR用来在我们生活中有很大的改变程度。这个大家可能比较关心,这个大家看到我就不用太多解释。

我们在做什么?具体一点就是将过去十多年积累的软、硬件,包括技术和行业等方面的人脉,汇集起来注到云端相结合的产品线,铸成AR的平台,并和行业伙伴进行合作,再向纵深发展。

为什么这么做?大家可以看看AR行业产业链,中间分了三大块,右上角其实是软件,就是核心的算法,左上角就是硬件,不管是说现在的手机还是将来的硬件,中间这一块是内容。三大块中其实我们最发力就是软硬件技术,内容则跟行业合作伙伴进行整合。目前我们整个产品线的构造,就以SDK作为一个切入点,因为这是最核心的人工智能的算法,它向上可以把将来的软件嵌入到我们的操作系统里面去,然后用它来支持平台,将来这套软件是用在智能软件设备,下面部分内容其实可以提炼出来放到芯片里面去,横向其实是跟合作伙伴进行合作联合,这是整个一个构思。

前面讲了两条线,一条是软件,另一条线是开放平台,另外一个是智能眼镜。下面将跟大家分享一下之前开放平台的功能,包括方向。这是我们目前支持开放的接口,在这里其实我们向很多合作伙伴比如内容提供,一般他们只需要我们内容发布平台和浏览器,形成内容生成和用户使用的。大家如果感兴趣可以去我们的网站,现在已经免费开放,大家可以申请试用,欢迎大家多提出意见,这是我们国产品牌支持本土。

另外再谈一下智能眼镜。大家知道前几个月去了微软,去帝国理工看了眼镜,然后对我们提出来要求,然后我们的确在这么做。这是我们11月推出来的增强现实的,这是功能机,其实还是比较粗糙,但是我觉得首先是把这个流程跑起来,以后再去做优化。第一版大概有六套,时间比较忙没有带过来,大家如果感兴趣的话欢迎到上海办公室体验。格式转换大家根据自己的爱好。这是当时发布会的现场,然后实体的眼镜。

简单来讲,这是一个基于视觉的增强现实的智能眼镜,目前在国内应该发布的,这是第一各也是唯一的一个,主要是可以把之前看到软件上的功能移植到硬件上,做一个软硬一体。另外一个方面光学融合是双目的,大家知道为什么眼镜是叫glasses?因为有两块镜片,这个不是随便的,大家知道Google glass它没有说Google glasses。其实有这一点,这将对应它底下的功能。

今天讲了这么多,最后跟大家分享一首王安石的诗,“看似寻常最奇崛,成如容易却艰辛”。就是很多事情看上去很简单,很简陋,其实精妙的地方就在其中;很事情看起来很容易,但做成却异常艰难。今天就到这里,谢谢大家!



举报 | 1楼 回复

友情链接