硬件性能和全方位细节的大幅提升。正如“硬件不 ready ”提到的,这并非「改进屏幕,改进芯片,改进扬声器…」之类的简单操作,而是芯片、配件、交互设计和操作系统的全方位配合结果——而这正是 Apple 的擅长:相比十几年前的 iPod 和 iPhone, Apple 已经以数十年的积累完成了多个设备操作系统的协同。
用户设备保有量的爆发前夜。正如上文对开发者和用户心态的剖析,这个“鸡生蛋还是蛋生鸡”的问题,Killer App 很难在 XR 设备 MAU 仅为小几百万的时候出现。在《塞尔达传说·荒野之息》的巅峰时刻,游戏卡带在美国的销量甚至比 Switch 的保有量还高——这是“新生硬件如何进入 mass adoption 的绝佳案例。为了体验 XR 而购买设备的人,会因为有限的体验内容而逐渐失望,谈论着自己的头显是如何落灰;但因为塞尔达而被吸引的玩家,很大部分会因为探索到更多 Switch 生态内的其它游戏而留下。
Source: The Verge
以及,统一的操作习惯,和较为稳定的设备更新兼容性。前者很好理解——有手柄和无手柄,带来的是两种用户与机器交互的行为习惯和体验,而这正是 Apple Vision Pro 和市面上其它 VR 设备的区分。而后者,则可以在 Oculus 硬件的迭代中看到例证——同一世代内硬件性能的大提升反而会限制用户体验。2022 年发售的 Meta Quest Pro 相比 2020 年发售的 Oculus Quest 2 (又名 Meta Quest 2)在硬件性能上有大幅提升:Quest Pro 的分辨率从 Quest 2 的 4 K 显示屏提升到了 5.25 K,色彩对比度提升了 75% ,刷新率从原有的 90 HZ 提升到了 120 HZ 。在 Quest 2 的 4 个用于理解 VR 外部环境的摄像头之外,增加了 8 个外部摄像头,让黑白的环境影像变成了彩色,并显着改善了手部追踪,同时还增加了面部和眼部追踪。同时,Quest Pro 还使用了“注视点渲染”,将算力集中在眼球注视的地方并弱化其他部分的保真度,从而节省算力和耗电量。正如上述所言,Quest Pro 的功能比 Quest 2 强大得多,但使用 Quest Pro 的用户可能不到 Quest 2 的 5% 。这意味着,开发者将同时针对两种设备开发游戏——这会大大限制对 Quest Pro 优势的利用,也反向降低了 Quest Pro 对用户的吸引力。History Rhymes, 同样的故事也曾在游戏主机一次一次地发生,这也是主机厂商以 6-8 年为一个世代进行软硬件更新的原因,买了 Switch 初代的用户并不会担心后续 Switch OLED 等硬件带来新推出游戏软件的不兼容,但购买 Wii 系列的用户则无法游玩 Switch 生态的游戏。对针对主机游戏的软件开发商而言,他们生产的游戏并非针对手机这种用户基数极大(3.5 亿 vs. 数十亿)、用户依赖性极强(在家空闲消遣 vs. 全天候携带)的产品,需要数个开发周期内稳定的硬件体验避免用户的过度分流,或者,就只能如现在的 VR 软件开发商一样,向下兼容以保证足够的用户基数。
那么,Vision Pro 能够解决上述问题吗?又会给行业带来怎样的转变?
Vision Pro 带来的转机
6 月 7 日的发布会上,Apple Vision Pro 发布,按上面我们分析的“ MR 在硬件和软件所遇到的挑战”框架,可以进行如下类比:
硬件:
视觉上,Vision Pro 使用了两块 4 K 的屏幕,使用了合计约 6 K 的像素,是目前 MR 设备的次顶配。刷新率可支持高达 96 HZ,并支持 HDR 视频播放,据体验的科技博主描述,不仅清晰度很高,几乎完全感觉不到眩晕。
续航上,Vision Pro 的续航为 2 h, 和 Meta Quest Pro 基本持平(并不算惊艳,也是目前 Vision Pro 受到诟病的点。但由于 Vision Pro 是外接电源,加上头显中放了一个 5000 mA 的小电池,可以猜测给更换电源接力续航留有余地)。
重量上,据科技媒体的体验,大约为 1 磅(454 g),与 Pico 和 Oculus Quest 2 基本持平,应该比 Meta Quest Pro 要轻,在 MR 设备里算是不错的体验(虽然这并没有算上拴在腰部电源的重量)。但相对 80 g 左右的纯 AR 眼镜(如 Nreal, Rokid 等),仍然沉重闷热。当然,纯 AR 眼镜大多需要与其它设备连接,仅能作为拓展屏幕使用,相比之下,自带芯片、有真实沉浸体验的 MR 可能是一种截然不同的体验。
此外,硬件性能上,Vision Pro 不仅搭载了目前性能最为顶尖的 M 2 系列芯片用于系统和程序运作,而且还加了一个特别为 MR 屏幕、周遭环境监控、眼球和手势监控等开发的 R 1 芯片,用于 MR 专有的显示、交互功能。
软件上,Apple 不仅可以凭借其数百万开发者生态完成一定程度的迁移,而且实际上已经凭借 AR Kit 的发布早已有了一系列生态布局:
早在 2017 年,Apple 就发布了 AR Kit: 一套与 iOS 设备兼容的虚拟现实开发框架,允许开发人员创建增强现实应用程序并利用 iOS 设备的硬件和软件功能。VR Kit 可以通过使用 iOS 设备上的摄像头创建该区域的地图,使用 CoreMotion 数据检测桌面、地板和设备在物理空间中的位置等事物来实现数字资产在摄像头下与现实世界进行互动——比如,你可以在 Pokemon Go 里看到埋在土里、停在树上的宝可梦,而不是大剌剌地显示在屏幕上随摄像头而移动。用户无需对此进行任何校准——这是无缝的 AR 体验。
2017 年,AR Kit 发布, 能够自动检测位置、拓扑和用户的面部表情,进行建模和表情捕捉。
2018 年,AR Kit 2 发布,带来了更好的 CoreMotion 体验,多人 AR 游戏、跟踪 2 D 图像以及检测已知的 3 D 物体(如雕塑、玩具和家具)成为可能。
2019 年,AR Kit 3 发布,添加了进一步增强现实的功能,可以使用 People Occlusion 在人的前面或后面显示 AR 内容,它最多可以跟踪三张脸。还可以支持协作会话,实现全新的 AR 共享游戏体验。运动捕捉可用于了解身体位置和运动,跟踪关节和骨骼,从而实现涉及人而不仅仅是物体的新 AR 体验。
2021 年,AR Kit 5 发布,开发者可以构建自定义着色器、程序网格生成、对象捕获和进行角色控制。此外,还可以使用内置 API 以及 iOS 15 设备中的 LiDAR 和摄像头捕获对象。开发者可以扫描一个对象并立即将其转换为 USDZ 文件,该文件可以导入 Xcode 并在您的 ARKit 场景或应用程序中用作 3 D 模型。这大大提升了 3 D 模型的制作效率。
2022 年,AR Kit 6 发布,新版 ARKit 包含了“MotionCapture”功能,可追踪视频帧中的人物,并为开发者提供了可预估人类头部和四肢位置的角色“骨架”,从而支持开发者创建应用程序,进而将 AR 内容叠加至角色,或隐藏于角色身后,以更真实与场景融为一体。
回顾 AR Kit 从七年前就已经开始的布局,可以看出,Apple 在 AR 方面的技术积累并非一朝一夕,而是潜移默化地先将 AR 体验融入已经广泛传播的设备中,Vision Pro 发布之时,Apple 已经完成了一定的内容和开发者积累。同时,由于 AR Kit 开发的兼容性,开发出来的产品不仅是面向 Vision Pro 的用户,也能在一定程度上适应 iPhone 和 iPad 的用户。开发者可能不需要受限于 300 万月活跃用户的天花板来开发产品,而是潜在地面向数亿 iPhone 和 iPad 用户进行测试和体验。
此外,Vision Pro 的 3 D 视频拍摄也部分解决了如今 MR 内容有限的难题:内容生产。现有的 VR 视频大多是 1440 p,在 MR 头显的环形屏幕体验里显得像素很差,而 Vision Pro 的拍摄则兼具高像素的空间视频和不错的空间音频体验,或将大幅提升 MR 的内容消费体验。
尽管上述配置已经相当震撼,苹果 MR 的想象力并不止步于此:Apple MR 发布的当天,一位自称曾参与过 Apple 神经科学方面的开发者 @sterlingcrispin 如此说道:
Generally as a whole, a lot of the work I did involved detecting the mental state of users based on data from their body and brain when they were in immersive experiences.
总的来说,我从事的许多工作都涉及通过用户在沉浸式体验中的身体和大脑数据来检测其心理状态。
So, a user is in a mixed reality or virtual reality experience, and AI models are trying to predict if you are feeling curious, mind wandering, scared, paying attention, remembering a past experience, or some other cognitive state. And these may be inferred through measurements like eye tracking, electrical activity in the brain, heart beats and rhythms, muscle activity, blood density in the brain, blood pressure, skin conductance etc.
There were a lot of tricks involved to make specific predictions possible, which the handful of patents I’m named on go into detail about. One of the coolest results involved predicting a user was going to click on something before they actually did. That was a ton of work and something I’m proud of. Your pupil reacts before you click in part because you expect something will happen after you click. So you can create biofeedback with a user’s brain by monitoring their eye behavior, and redesigning the UI in real time to create more of this anticipatory pupil response. It’s a crude brain computer interface via the eyes, but very cool. And I’d take that over invasive brain surgery any day.
Other tricks to infer cognitive state involved quickly flashing visuals or sounds to a user in ways they may not perceive, and then measuring their reaction to it.
其他推断认知状态的技巧包括以用户可能不察觉的方式快速闪烁视觉或声音,并测量他们对其的反应。
Another patent goes into details about using machine learning and signals from the body and brain to predict how focused, or relaxed you are, or how well you are learning. And then updating virtual environments to enhance those states. So, imagine an adaptive immersive environment that helps you learn, or work, or relax by changing what you’re seeing and hearing in the background.
当然,Vision Pro 并非没有硬伤,比如其 $ 3499 的天价,是 Meta Quest Pro 的两倍有余,Oculus Quest 2 的七倍有余,对此,Runway 的 CEO Siqi Chen 如是说:
it might be useful to remember that in inflation adjusted dollars, the apple vision pro is priced at less than half the original 1984 macintosh at launch (over $ 7 K in today’s dollars)
也许大家需要记得,根据通胀调整后的美元价格,Apple Vision Pro 的定价不到 1984 年 Macintosh 推出时的一半(相当于今天超过 7000 美元)。
在这样的类比下,Apple Vision Pro 的定价看上去并不算过于离谱……但是,Macintosh 第一代的销量仅 37.2 万台,很难想象在 MR 上下大功夫的 Apple 能接受类似的尴尬处境——几年内的现实可能并不会有大的改变,AR 不一定需要眼镜,短期内 Vision Pro 也难以大量普及,很可能仅作为开发者体验和测试的工具,创作者的生产工具,和数码发烧友昂贵的玩具。
在 6 月 10 日发布的 Medium 文章中,Render Network 宣称,Octane 针对 M 1 和 M 2 的渲染能力是独一无二的——由于 Vision Pro 也采用 M 2 芯片,在 Vision Pro 中进行渲染并不会与普通桌面渲染有区别。
但问题是:为什么要在一台续航 2 小时,主要用于体验玩耍,而非生产力工具的设备上发布渲染任务?如果 Vision Pro 价格降下来,续航大提升,重量轻下来,真正实现 Mass Adoption, 可能才会到有 Octane 发挥作用的时机…
可以确认的是,数字资产从平面设备往 MR 设备的迁移,确实会带来对基础设施的需求增长。宣布与 Apple 合作研究如何制造更适配 Vision Pro 的游戏引擎 Unity,当日股价上涨 17% ,也说明了市场对此的看好情绪。随着迪士尼和 Apple 的合作,传统影视内容的 3 D 化或将迎来类似的需求增长。擅长影视渲染的 Render Network 在今年二月推出了结合 AI 的 3 D 渲染技术 NeRFs,利用人工智能计算和 3 D 渲染来创建可以在 MR 设备上查看的实时沉浸式 3 D 资产 – 在 Apple AR Kit 的支持下,任何人都可以通过较高配置的 iPhone 对物体进行 Photoscan 以生成 3 D 资产,而 NeRF 技术则通过 AI 加成的渲染,将简陋的 Photoscan 3 D 渲染成不同角度可以折射出不同光线的沉浸式 3 D 资产——这种空间渲染将是 MR 设备内容生产的重要工具,为 Render Network 提供了潜在的需求。
这让我想到另一则视频, 2011 年,也就是 12 年前,微软发布了 Windows Phone 7 (作为对那个年代没有多少记忆的 Gen Z, 很难想起来微软也曾在手机上下过大功夫),并制作了一则关于智能手机的讽刺广告“Really?”:广告里的人们每时每刻都紧握手机,盯着手机骑单车,盯着手机在沙滩太阳浴,紧握手机洗澡,在宴会上因为看着手机下楼梯而摔倒,甚至因为分神把手机掉进小便池……微软的本意是向用户展示“微软发布的手机,会把我们从手机上瘾中拯救出来”——这当然是一败涂地的尝试,这个“Really?”的广告名甚至可以改成“Reality”。智能手机的“在场感”和符合直觉的交互设计就是比反人类的“手机版 windows 电脑”更让人沉迷,就像虚实结合的现实就是比纯粹的现实更让人上瘾。
怎样把握这样的未来?我们有几个正在探索的方向:
沉浸式体验和叙事的创造:首先是视频,在 Vision Pro 发布之后,拍摄“具有 3 D 深度”的电影从未像此时一样简单,而这也将改变人们对数字内容的消费方式——从“远距离欣赏”到“身临其境体验”。 在视频拍摄外,“有内容体验的 3 D 空间”可能是另一个值得关注的赛道。这里并不是意指从模板库随意搭建千篇一律的场景,或者从游戏中抽取的几个看似可探索的空间,而是“有互动,有原生内容,有 3 D 更友好”体验的空间。这样的空间可能是同样坐在琴凳上,让对应琴键高亮、并在你沮丧时温柔鼓励的帅气钢琴教练;可以是在你房间的一角藏了通往下一关游戏钥匙的小精灵;也可以是善解人意陪玩家散步的虚拟女友…… 此处催生的创作者经济则可以很好地用区块链底层去信任、自动结算、资产化数字内容、低沟通磨损交易。创作者可以更好地使用它们去中介化地跟粉丝互动,不需要麻烦地注册公司再设置 Stripe 接收付款,也不需要给平台 10% (Substack)-70% (Roblox) 的分成,甚至不需要担心平台会不会倒闭带走你留下的心血……一个钱包,具有可组合性的内容平台,去中心化存储就可以解决问题。 类似的升级将发生在游戏和社交空间,甚至可以说,游戏、电影和社交空间之间的分野将越发模糊:当体验不再是相距数米悬浮的大屏幕,而是近在眼前,有深度、有距离、有空间感音频的交互,玩家不再是“观赏”的观众,而是在场参与,甚至行动会影响虚拟世界环境的角色(比如在丛林里抬起手,蝴蝶会飞到你的指尖)。
3 D 数字资产的 infra 和社区:Vision Pro 的 3 D 拍摄功能将大大削减 3 D 视频创作的难度,从而催生一个新兴内容生产、消费的市场。对应的素材交易、剪辑等上下游 infra 可能继续由现有的巨头们把持,也可能像 AIGC 由创业公司开辟新天地。
提升沉浸体验的硬件/软件升级:不管是 Apple 正在钻研的“对人体更详尽的观测以创造自适应的环境”,还是增加触觉、味觉等沉浸体验,都是具有相当潜力的赛道。
当然,这个领域的创业者大概率会比我们有更深入的理解、思考和更具有创造力的探索——欢迎 DM @0 x scarlettw 交流和探讨空间计算时代的可能性。
Apple Vision Pro发布满月再思考:XR、RNDR和空间计算的未来
原文作者:Scarlett Wu
6 月 6 日的 WWDC(苹果全球开发者大会)凌晨,也是发现自己 covid 二阳的第五天,我摆着养生茶跟朋友连麦唠嗑 : 一小时过去了,这次的 One More Thing 不会又推迟了吧?
于是等到凌晨两点库克出现,大手一挥 “One More Thing”,屏幕这端的我跟朋友一起欢呼:
作为前沿科技爱好者,我为明年可以拥有的新玩具欢呼,但作为关注游戏、元宇宙和 AI 的 Web 3 投资人,这是一个让我颤栗的新时代标志。
你可能会感到怀疑,“MR 硬件的升级跟 Web 3 有什么关系?”那么,我们先从 Mint Ventures 对元宇宙赛道的 Thesis 聊起。
我们对元宇宙,或者说 Web 3 世界的 Thesis
区块链世界的资产溢价,来源于:
虚拟世界的商品比实体商品更容易证券化:
那么,下一步会是什么? 可交易的虚拟世界资产将是我们始终看好的主题。
随着虚拟世界的体验提升,人们在虚拟世界中的沉浸时间会越来越长,从而带来注意力的转移。而注意力的转移也将带来估值溢价从强依附于实体向虚拟资产转移。Apple Vision Pro 的发布,将彻底改变人类跟虚拟世界交互的体验,从而带来虚拟世界沉浸时长增长,和沉浸体验的大幅提升。
注:这是我们对于定价策略的变体定义,在溢价定价策略中,品牌将价格定在一个远高于成本的价格区间,在定价和成本的差值里填充品牌故事和体验。此外,成本定价、竞争定价、供需关系等等也是商品定价时会考虑的要素,此处仅针对溢价定价进行展开。
MR 行业的历史和现在
现代社会对 XR (Extended Reality 拓展现实,包括 VR 和 AR) 的探索始于十多年前:
当我们回顾 XR 的历史,可以看出这个行业的拓展和培育难度远远超出市场上所有人的预估,不管是财大气粗手握众多科学家的科技巨头,还是聪明能干融资上亿专注 XR 的创业公司。2016 年消费级 VR 产品 Oculus Rift 发布以来,所有 VR 品牌,如三星的 Gear, 字节的 Pico, Valve 的 Index, 索尼的 Playstation VR, HTC 的 Vive 等,累计出货量不到 4500 万台。由于 VR 设备目前最广泛的用途仍然是游戏,在 Vision Pro 发布之前,人们愿意偶尔使用的 AR 设备并没有出现,根据 SteamVR 的数据,可较为粗略地推断,VR 设备的月活跃用户可能仅有小几百万。
XR 设备为什么得不到普及?无数创业公司的失败经验和投资机构的总结可以给出一些答案:
1. 硬件不 Ready
视觉上,VR 设备由于视角更广,离眼球更近,即使是最顶尖的设备,屏幕上的像素点仍然难以忽视。单眼 4 k, 也就是双眼 8 k 的分辨率才能充分沉浸。此外,刷新率也是维持视觉体验的核心要素。市面上普遍认为,为了达到防晕眩的效果,XR 设备需要每秒 120 HZ,甚至 240 HZ,来维持类似现实世界的体验。而刷新率,在同等的计算能力下,是需要与渲染水平平衡的要素:Fortnite 在 60 HZ 的刷新率下支持 4 k 清晰度,而在 120 HZ 的刷新率下则仅支持 1440 p 的清晰度。
因为跟视觉的直观相比,听觉短时间内显得似乎不值一提,大多数 VR 设备都没有在这个细节上下功夫。但想象一下在一个空间里里不管是左侧还是右侧的人,说话的声音都稳定地从头顶传过来,会大幅削减沉浸感。而当 AR 空间里的数字 Avatar 被固定在客厅里,玩家从卧室走向客厅时听到 Avatar 说话的音量大小相同,也会微妙地降低空间的真实感。
交互上,传统的 VR 设备都配有控制手柄,更有如 HTC Vive 需要在家里安装摄像头以确认玩家的移动状态。虽然 Quest Pro 有眼动追踪,但延迟高、灵敏度一般,主要用于局部渲染加强,实际交互操作仍以手柄为主。同时,Oculus 也在头显上安装了 4 – 12 个摄像头以确认用户所在的场景状态,达成一定程度上的手势交互体验(比如,在 VR 世界里用左手捡起一部虚拟手机,右手食指虚空点击确认开启游戏)。
重量上,让人体感舒适的设备质量应该在 400-700 g 之间(虽然相比正常 20 g 左右的眼镜,这仍然是庞然大物)。但为了达到上述清晰度、刷新频率、交互水平、与其渲染要求匹配的计算能力(芯片性能、大小和数量),和数小时的基础续航要求,XR 设备的重量是一个艰难的取舍过程。
综上,如果要实现 XR 成为下一代的手机,成为新一代大众硬件,需要分辨率 8 k 以上的设备,且刷新率大于 120 HZ 以避免用户感到眩晕。这个设备应该拥有十几枚摄像头, 4 小时甚至更长(只需要午饭/晚饭休息时取下)的续航能力,不发热或少发热,重量小于 500 g, 且价格低至 500 – 1000 美元。现在的技术实力,尽管相比上一波 15 – 19 年的 XR 热潮已经提升不少,但达到上述标准仍然具有难度。
但即便如此,如果用户开始体验现有的 MR(VR + AR) 设备,会发现目前的体验虽然不算完美,也是 2 D 屏幕无法比拟的沉浸的体验。但这种体验仍有相当大的提升空间——拿 Oculus Quest 2 举例,大多数可以观看的 VR 视频都是 1440 p,甚至没有达到 Quest 2 4 K 的分辨率上限,刷新率也远不到 90 HZ。而现有的 VR 游戏,仅有相对拙劣的建模,且可供尝试的选择并不多。
2. Killer App 仍未出现
Killer App 的“尚未出现”有其受困于硬件的历史原因——即使 Meta 尽力压缩利润空间,几百美元的 MR 头显与相对简陋的生态,相比现有生态丰富、用户基数已成规模的游戏主机,仍然不具有吸引力。VR 的设备保有量在 2500 – 3000 万之间,而与之对比的, 3 A 游戏的终端(PS 5, Xbox, Switch, PC)保有量为 3.5 亿。因此,大多数厂商都放弃支持 VR,支持 VR 设备的少数游戏也是“顺带布局 VR 平台”,而非“仅支持 VR 设备”。此外,由于在第一点中提及的,像素点、晕眩、续航差、重量过沉等问题,VR 设备的体验并没有比传统 3 A 游戏终端更好。而 VR 支持者试图强调的“沉浸”优势,则由于设备保有量的不足,“顺带布局 VR 设备”的开发者鲜有专门做针对 VR 设计的体验和交互模式,难以达到理想体验。
因此,目前的局面是,当玩家选择 VR 游戏而不是非 VR 游戏,他们不仅是“选择了一款新游戏”,而且“放弃了与大部分朋友社交的体验”,这样的游戏场景往往是游戏性、沉浸体验远大于社交性。当然,你可能会提及 VR Chat,但如果深入挖掘会发现,其中 90% 的用户并非 VR 用户,而是在普通的屏幕前想体验以各种 Avatar 跟新朋友社交的玩家。因此,VR 软件中最受欢迎的游戏是《节奏光电》这样的音游也就不足为奇。
所以我们认为,Killer App 的出现,需要以下几个要素:
那么,Vision Pro 能够解决上述问题吗?又会给行业带来怎样的转变?
Vision Pro 带来的转机
6 月 7 日的发布会上,Apple Vision Pro 发布,按上面我们分析的“ MR 在硬件和软件所遇到的挑战”框架,可以进行如下类比:
硬件:
软件上,Apple 不仅可以凭借其数百万开发者生态完成一定程度的迁移,而且实际上已经凭借 AR Kit 的发布早已有了一系列生态布局:
早在 2017 年,Apple 就发布了 AR Kit: 一套与 iOS 设备兼容的虚拟现实开发框架,允许开发人员创建增强现实应用程序并利用 iOS 设备的硬件和软件功能。VR Kit 可以通过使用 iOS 设备上的摄像头创建该区域的地图,使用 CoreMotion 数据检测桌面、地板和设备在物理空间中的位置等事物来实现数字资产在摄像头下与现实世界进行互动——比如,你可以在 Pokemon Go 里看到埋在土里、停在树上的宝可梦,而不是大剌剌地显示在屏幕上随摄像头而移动。用户无需对此进行任何校准——这是无缝的 AR 体验。
回顾 AR Kit 从七年前就已经开始的布局,可以看出,Apple 在 AR 方面的技术积累并非一朝一夕,而是潜移默化地先将 AR 体验融入已经广泛传播的设备中,Vision Pro 发布之时,Apple 已经完成了一定的内容和开发者积累。同时,由于 AR Kit 开发的兼容性,开发出来的产品不仅是面向 Vision Pro 的用户,也能在一定程度上适应 iPhone 和 iPad 的用户。开发者可能不需要受限于 300 万月活跃用户的天花板来开发产品,而是潜在地面向数亿 iPhone 和 iPad 用户进行测试和体验。
此外,Vision Pro 的 3 D 视频拍摄也部分解决了如今 MR 内容有限的难题:内容生产。现有的 VR 视频大多是 1440 p,在 MR 头显的环形屏幕体验里显得像素很差,而 Vision Pro 的拍摄则兼具高像素的空间视频和不错的空间音频体验,或将大幅提升 MR 的内容消费体验。
尽管上述配置已经相当震撼,苹果 MR 的想象力并不止步于此:Apple MR 发布的当天,一位自称曾参与过 Apple 神经科学方面的开发者 @sterlingcrispin 如此说道:
这些与神经科学高度相关的技术,可能将标志着机器和人类意志崭新的同步方式。
当然,Vision Pro 并非没有硬伤,比如其 $ 3499 的天价,是 Meta Quest Pro 的两倍有余,Oculus Quest 2 的七倍有余,对此,Runway 的 CEO Siqi Chen 如是说:
在这样的类比下,Apple Vision Pro 的定价看上去并不算过于离谱……但是,Macintosh 第一代的销量仅 37.2 万台,很难想象在 MR 上下大功夫的 Apple 能接受类似的尴尬处境——几年内的现实可能并不会有大的改变,AR 不一定需要眼镜,短期内 Vision Pro 也难以大量普及,很可能仅作为开发者体验和测试的工具,创作者的生产工具,和数码发烧友昂贵的玩具。
尽管如此,我们可以看到,Apple 的 MR 设备已经开始搅动市场的风云,将普通用户对数码产品的吸引力重新转移到 MR 上,让大众意识到 MR 已经是较为成熟、不再是 ppt / 演示视频类产品。让用户意识到,在平板、电视、手机之外,还有一个头戴沉浸式显示器的选择;让开发者意识到,MR 可能真正成为了下一代硬件的新趋势;让 VC 意识到,这可能是一个有极高天花板的投资领域。
Web 3 与相关的生态
1. 3 D 渲染 + AI 概念标的:RNDR
RNDR 简介
在过去的半年里,RNDR 已经作为元宇宙、AI、MR 三重概念结合的 meme,多次领涨市场。
RNDR 背后的项目是 Render Network, 一个利用去中心化网络实现分布式渲染的协议。Render Network 背后的公司 OTOY.Inc 成立于 2009 年,其渲染软件 OctaneRender 针对 GPU 渲染进行了优化。对普通创作者而言,本地进行渲染对机器的占用较高,这就产生了云渲染的需求,但如果租用 AWS,Azure 等厂商的服务器用于渲染,可能成本也会较高——这就产生了 Render Network,渲染不局限于硬件条件,连接创作者和拥有空闲 GPU 的普通用户,让创作者得以便宜、快速高效地进行渲染,节点用户可以利用闲置 GPU 赚份零花钱。
对于 Render Network 来说,参与者有两种身份:
RNDR 的 tokenomics 也今年 2 月进行了更改,这也是它价格大涨的原因之一(但直到文章发布,Render Network 尚未将新的 tokenomics 应用到网络中,也暂未给出具体上线时间):
此前,在网络中,$RNDR 的购买力和 Credit 的购买力是一样的,而 1 credit = 1 欧元。在 $RNDR 价格小于 1 欧元时,购买 $RNDR 相比法币购买 Credit 更划算,但当 $RNDR 的价格提升到超过 1 欧元,因为大家都倾向于用法币进行购买,则会出现 $RNDR 失去用例的情况。(虽然协议收入可能会进行 $RNDR 的回购,但市场上其他玩家没有购买 $RNDR 的动力。)
而更改后的经济模型采用了 Helium 的”BME”(Burn-Mint-Emission)模式,创作者购买渲染服务时不管是用法币还是 $RNDR,都会销毁等 95% 法币价值的 $RNDR,剩余 5% 流向基金会作为引擎使用的收入。而节点提供服务时,则不再直接获得创作者购买渲染服务的收入,而是获得新铸造的代币奖励,奖励的依据不仅基于任务完成的指标,还包括客户满意度等其他综合因素。
值得注意的是,每个新 epoch(特定时间阶段,尚未说明具体时长)都将有新的 $RNDR 被铸造,且铸造量被严格限定,随时间推移递减,与代币燃烧的数量无关(详见官方白皮书的释放文档)。因此,会带来对下述 Stakeholders 的利益分配变化:
相比之前收入(不定期)回购的模式,新的模式下,在渲染任务需求不足时,矿工可以得到比之前更多的收入,而在渲染任务需求对应的任务价格总额大于释放的 $RNDR 奖励总额时,矿工相比原有模型将获得更少的收入(燃烧掉的 token > 新铸造的 token),$RNDR 代币也会进入通缩状态。
虽然最近半年 $RNDR 涨势喜人,Render Network 的业务情况并没有如币价一般有大幅增长:过去两年的节点数量没有大幅波动,每月分配给节点的 $RNDR 也没有大幅增长,但渲染的任务数量确实有提升——可见创作者分配给网络的任务由单笔较大金额,逐渐走向了多笔小金额)。
虽然赶不上一年五倍的币价涨幅,Render Network 的 GMV 确实迎来了较大的增长, 2022 年 GMV(Gross Merchandise Value,成交总额)相比去年增加 70% 。根据 Dune 看板的 $RNDR 分配给节点的总量, 2023 年上半年 GMV 约为 $ 1.19 M,相比 2022 年同期基本没有涨幅。这样的 GMV 在 7 亿美元的 mCap 上显然不够看。
Vision Pro 的推出对 RNDR 的影响
在 6 月 10 日发布的 Medium 文章中,Render Network 宣称,Octane 针对 M 1 和 M 2 的渲染能力是独一无二的——由于 Vision Pro 也采用 M 2 芯片,在 Vision Pro 中进行渲染并不会与普通桌面渲染有区别。
但问题是:为什么要在一台续航 2 小时,主要用于体验玩耍,而非生产力工具的设备上发布渲染任务?如果 Vision Pro 价格降下来,续航大提升,重量轻下来,真正实现 Mass Adoption, 可能才会到有 Octane 发挥作用的时机…
可以确认的是,数字资产从平面设备往 MR 设备的迁移,确实会带来对基础设施的需求增长。宣布与 Apple 合作研究如何制造更适配 Vision Pro 的游戏引擎 Unity,当日股价上涨 17% ,也说明了市场对此的看好情绪。随着迪士尼和 Apple 的合作,传统影视内容的 3 D 化或将迎来类似的需求增长。擅长影视渲染的 Render Network 在今年二月推出了结合 AI 的 3 D 渲染技术 NeRFs,利用人工智能计算和 3 D 渲染来创建可以在 MR 设备上查看的实时沉浸式 3 D 资产 – 在 Apple AR Kit 的支持下,任何人都可以通过较高配置的 iPhone 对物体进行 Photoscan 以生成 3 D 资产,而 NeRF 技术则通过 AI 加成的渲染,将简陋的 Photoscan 3 D 渲染成不同角度可以折射出不同光线的沉浸式 3 D 资产——这种空间渲染将是 MR 设备内容生产的重要工具,为 Render Network 提供了潜在的需求。
但这个需求是否会由 RNDR 来满足?观察其 2022 年 200 万美元的 GMV,相比影视行业投入的成本可谓九牛一毛。综上,RNDR 当然可能继续以“元宇宙、XR、AI”赛道的 meme 在赛道火热时再创价格辉煌,但要产生与估值相匹配的收入仍然难度较大。
2. 元宇宙 – Otherside, Sandbox, Decentraland, HighStreet 等
虽然我认为实质上的基本面改变有限 – 但与 MR 相关的话题似乎也绕不开这几个大型元宇宙项目,猴子的 Otherside, Animoca 系的 The Sandbox,最古老的区块链元宇宙 Decentraland,以及想做 VR 世界 Shopify 的 Highstreet.(对元宇宙赛道的详尽分析参考 的 4. 业务分析 – 行业分析与潜力部分)
但正如上文在“Killer App 仍未出现”中分析的,大多数现有支持 VR 的开发者,并非“仅支持 VR”(就算仅支持 VR 且做到了行业头部,在一个百万量级 MAU 细分市场里做到头部也不是碾压级别的竞争力),已有的产品并未对 MR 的用户习惯、操作交互做细致的适配。而暂未推出的项目实际上和其他所有看到 Vision Pro 潜力的大厂、创业公司实际上站在相距不远的起跑线上:在 Unity 与 Vision Pro 做出更好的结合之后,MR 生态游戏开发的学习成本有望降低,过往较为狭窄的市场积累起来的经验难以在一个即将走向 mass adoption 的产品里复用。
当然,如果要谈及先发优势,已经布局 VR 的项目当然可能有微弱的开发进度、技术和人才积累的优势。
One More Thing
如果你没有看过下面这个视频,那么这将是你对 MR 世界最为直观的感受:便捷、沉浸,但又混乱、无序。虚拟与现实融合得如此无缝,被虚拟现实宠坏的人们将「失去设备中的身份」视为世界末日般的大事。视频里的细节在现在的我们看来,仍然觉得有点科幻和难以理解——但这很可能就是我们即将面对的,数年内的未来。
这让我想到另一则视频, 2011 年,也就是 12 年前,微软发布了 Windows Phone 7 (作为对那个年代没有多少记忆的 Gen Z, 很难想起来微软也曾在手机上下过大功夫),并制作了一则关于智能手机的讽刺广告“Really?”:广告里的人们每时每刻都紧握手机,盯着手机骑单车,盯着手机在沙滩太阳浴,紧握手机洗澡,在宴会上因为看着手机下楼梯而摔倒,甚至因为分神把手机掉进小便池……微软的本意是向用户展示“微软发布的手机,会把我们从手机上瘾中拯救出来”——这当然是一败涂地的尝试,这个“Really?”的广告名甚至可以改成“Reality”。智能手机的“在场感”和符合直觉的交互设计就是比反人类的“手机版 windows 电脑”更让人沉迷,就像虚实结合的现实就是比纯粹的现实更让人上瘾。
怎样把握这样的未来?我们有几个正在探索的方向:
当然,这个领域的创业者大概率会比我们有更深入的理解、思考和更具有创造力的探索——欢迎 DM @0 x scarlettw 交流和探讨空间计算时代的可能性。
致谢和参考资料:
感谢 Mint Ventures 的合伙人 @fanyayun 及研究合伙人 @xuxiaopengmint 在本篇文章写作过程中的建议、审阅和校对。XR 的分析框架来源于 @ballmatthew 的系列文章、Apple WWDC 和开发者课程,以及笔者对市面上各种 XR 设备的体验感受。