技术

Genie 3发布：谷歌DeepMind让AI生成“可进入”的VR世界

2025-08-07

当AI生成内容从“观看”走向“进入”，我们距离科幻电影中的沉浸式虚拟世界还有多远？

谷歌旗下AI研究实验室DeepMind近日发布了其新一代生成式AI模型——Genie 3，一个能够根据简单文本提示，实时生成可交互、可导航虚拟环境的系统。这一进展，被外界视为向《星际迷航》中“全息甲板”（Holodeck）概念迈进的又一里程碑。

从“生成视频”到“生成世界”：一次范式跃迁

与当前主流的生成式AI不同，Genie 3 并不生成一段预渲染的静态视频，而是在运行时逐帧生成动态环境，支持用户实时交互与环境反馈。这意味着，用户不再是被动观看者，而是可以“进入”并影响AI所构建的世界。

据DeepMind介绍，Genie 3 能够在普通显示器上以 720p分辨率、24帧/秒 的性能运行。尽管目前仅支持平面屏幕，尚未适配VR头显（如Quest 3的双目2K+分辨率、90Hz刷新率需求），但其架构已展现出向高沉浸设备迁移的潜力。

更关键的是，这些生成的虚拟场景能在数分钟内保持视觉与物理一致性。系统具备某种形式的“短期记忆”，能记住用户此前的操作并反映在后续环境中——这是迈向持久化虚拟世界的重要一步。

可编程的虚拟宇宙：从江户时代到阿姆斯特丹运河

Genie 3 的能力边界极为广泛，可模拟：

自然景观（如森林、沙漠、极地）
历史场景（如1800年的 Osaka）
虚构世界（如动画风格城市）
动态事件系统：用户可通过文本指令触发“世界事件”，例如“下雨”、“出现一辆红色跑车”或“天空飞过恐龙”

这种“可提示化世界事件”（promptable world events）机制，赋予用户近乎上帝模式的控制力。你不仅能在阿姆斯特丹的运河上召唤一辆摩托艇，还能瞬间将天气从晴朗转为暴风雨。

不只是娱乐：为具身AI提供训练场

尽管Genie 3 的娱乐潜力显而易见，但DeepMind强调其更深层使命：作为具身AI（Embodied AI）的训练平台。

在机器人、游戏AI和通用人工智能（AGI）研究中，AI代理（Agents）需要在复杂、动态的环境中学习决策、执行动作并适应变化。Genie 3 提供了一个低成本、高灵活性的虚拟沙盒，可用于：

训练机器人在不同地形中导航
模拟多智能体协作与竞争
探索AI在开放世界中的长期行为演化

不过，DeepMind也坦承当前局限：

限制领域	具体挑战
代理动作空间	当前AI代理可执行的动作种类有限，复杂行为难以建模
多代理交互	在共享环境中，多个AI代理的协同与竞争模拟仍不成熟
地理精确性	难以完美还原真实世界地理位置与建筑细节
文本渲染	画面中的文字生成仍模糊不清，影响信息传达
长期稳定性	环境一致性通常只能维持几分钟，难以支持长时间任务

通往Holodeck的阶梯

尽管Genie 3 还远未达到“全息甲板”级别的沉浸感与物理真实，但它标志着生成式AI正从“内容生成”向“世界生成”演进。未来，当此类技术与VR/AR、物理引擎、神经渲染深度融合，我们或许真能实现：

一键进入任何历史时刻
实时构建可交互的游戏关卡
为AI提供无限训练场景

正如Will Smith吃意大利面的魔性视频曾震惊网络，Genie 3 预示着：下一个阶段，这些“荒诞模拟”将不再只是可看的，而是可进、可改、可玩的。

标签: 生成式AI

上一篇：把远方“搬”到手边：谷歌新论文提出MR代理交互系统

下一篇：Steam Frame背后的开源哲学：Valve如何用Linux打造下一代“可玩”VR设备

VR52

VR52网成立于2015年，平台提供VR头显、AR眼镜、配件外设、厂商、测评、行业资讯、游戏与应用、展会活动等。

技术

Genie 3发布：谷歌DeepMind让AI生成“可进入”的VR世界

从“生成视频”到“生成世界”：一次范式跃迁

可编程的虚拟宇宙：从江户时代到阿姆斯特丹运河

不只是娱乐：为具身AI提供训练场

通往Holodeck的阶梯

相关资讯

Steam Frame背后的开源哲学：Valve如何用Linux打造下一代“可玩”VR设备

一句话生成可探索3D世界：SpAItial AI推出空间生成模型「Echo」

单图秒级生成逼真3D：Apple发布全新技术「SHARP」

XR 生态战火重燃：Meta 与 Google 分庭抗礼，两大平台争夺空间计算未来

STYLY 推出面向 LBE 开发的开源项目，支持多人 XR 内容的创建和开发。

腾讯全球发布Hunyuan 3D引擎，AI重构3D内容生产链

VR52

热门VR眼镜

Meta Quest 3

Pico 4 Ultra

Pico 4 Ultra Enterprise

热门资讯

Xreal 推出具有原生 3DoF 跟踪、更大视野和内部 X1 芯片的新型 AR 眼镜

深入解读 Meta Quest v77 PTC 更新：眼动追踪及其他前沿功能

Meta Quest 推出重大更新，新增Windows集成等多项功能。

Play For Dream 在 Kickstarter 上众筹，将其 Apple Vision Pro 和 Quest Pro 跨界产品推向欧美

Zeta Surgical 混合现实颅骨外科手术导航系统获 FDA 批准

标签