• 技术

  • Godot 引擎加码 OpenXR:开源游戏引擎正成为 XR 开发新宠

    2025-11-25

    作为一款广受欢迎的开源游戏引擎,Godot近年来持续强化其在XR领域的支持能力。早在数年前,Godot就已集成基础的OpenXR支持,使开发者能够轻松将应用部署到多种XR头显设备上。如今,随着最新版本更新,Godot进一步拓展了OpenXR功能,意图吸引更多专注于VR与AR开发的团队。OpenXR是由KhronosGroup主导制定的一项开放、免版税的标准,旨在为VR/AR应用开发提供统一接口。目前主流XR平台普遍支持该标准--唯独苹果例外,其VisionPro采用自研API。渲染模型扩展落地,沉浸感再升级在近期发布的Godot4.5版本中,引擎正式引入了OpenXR渲染模型扩展。这一功能使得系统能够准确识别并渲染特定平台的硬件模型,例如手柄外观。对于XR应用而言,这种细节对营造真实沉浸感至关重要。据Godot首席XR维护者BastiaanOlij在博客中透露,更大的动作已在路上--即将随Godot4.6到来。在当前的开发者预览版(Godot4.6dev1)中,引擎已初步支持OpenXRSpatialEntities,涵盖空间锚点、平面检测和标记追踪等MR核心工具。这意味着开发者可以构建具备空间感知能力的持久化MR体验。性能与兼容性双提升Godot4.6同时新增对OpenXR1.1的支持,其中包含用于提升重投影质量的帧合成技术。此外,引擎还在推进QuadView渲染优化,以在用户注视焦点区域实现更高画质。另一项重大改进面向Android平台:开发者现在可打包一个通用APK,即可兼容所有支持OpenXR的XR设备,大幅简化分发流程。展望未来,Godot团队计划推进身体追踪标准化、扩展空间实体功能、实现多应用协同支持,并优化通用控制器的工作流。Olij特别指出,Khronos对Godot的资金与技术支持,确保了OpenXR等开放标准能够直接吸纳一线开发者的反馈,持续演进。

  • Meta 新推 SAM 3D Objects:数秒内将现实物体带入VR

    2025-11-25

    Meta最新发布的SAM3DObjects模型为从现实世界中快速生成高质量3D资产设定了新的标准。这项技术使得仅需一张图片,即可在数秒内将现实中的物体转化为虚拟世界中的3D对象,极大地简化了3D内容创作的流程。传统方法vsAI加速长久以来,利用摄影测量法(photogrammetry)通过拍摄数十张不同角度的照片来生成3D模型是主流做法。例如,EpicGames的RealityScan需要约15到45分钟的云端处理时间,而苹果公司则为其iPhonePro系列提供了大约需要5分钟的设备端物体捕捉API(ObjectCaptureAPI)。然而,随着AI技术的进步,近年来出现了可以从单张图像中迅速生成3D资产的先进模型。尽管这些模型的质量起初不如传统的摄影测量法,但随着每一次新模型的发布,其质量也在稳步提升,反映了AI领域整体上的快速发展。SAM3DObjects:下一代3D生成模型最近,Meta发布了SAM3DObjects,这是目前最先进的从单一图像生成3D资产的模型。用户可以通过访问Meta的AIDemos页面,在网页浏览器中免费体验这一功能。只需上传一张图片,并选择想要转换成3D模型的对象,几秒钟后就能看到该对象的3D视图,并可以使用鼠标或手指进行旋转查看。值得注意的是,Meta的演示网站并不完全适配移动屏幕,因此推荐使用PC、笔记本电脑、平板电脑或VR头显进行体验。此外,SAM3DObjects目前仅适用于无生命物体,不支持人物或动物的3D建模。虽然在线演示不允许下载生成的3D模型,但SAM3DObjects是开源项目,可在GitHub和HuggingFace上获取。这意味着开发者可以在提供GPU支持的云计算平台上托管此模型,进而实现类似于EchoTheReality演示的应用,但具有更高品质的输出效果--即直接从现实中"拉取"物体进入VR环境。应用前景与未来展望社交VR平台可以借此让用户在几秒钟内展示他们房间里的物品,或者用自己制作的真实物品装饰虚拟家园。虽然Meta尚未宣布计划将此功能添加到HorizonWorlds中,但这似乎是一个自然的发展方向,能够很好地补充Meta刚刚推出的Hyperscape世界。

  • Meta 发布 WorldGen:文本生成完整3D世界,但 Horizon Worlds 还用不上

    2025-11-25

    在AI生成3D内容的竞赛中,Meta最新推出的WorldGen系统再次将行业门槛推高--它能仅凭一段文字提示,自动生成几何一致、视觉丰富、可交互导航的三角网格。然而,Meta却坦言:这项技术尚未准备好集成到其社交VR平台HorizonWorlds中。从AssetGen到WorldGen:Meta的AI造世之路早在2025年5月,Meta就预告将在HorizonWorlds创作工具中引入"AI自动生成完整3D世界"的能力,并发布了相关模型AssetGen2.0。6月,该功能被正式命名为"EnvironmentGeneration"(环境生成),并展示了示例场景,称将"很快上线"。结果,8月上线的EnvironmentGeneration仅能生成一种特定风格的岛屿,与"通用世界生成"的愿景相去甚远。如今,Meta在一篇技术论文中正式披露了其更强大的下一代系统--WorldGen,这才是真正面向"任意文本生成任意世界"的终极方案。WorldGen是什么?不是GaussianSplat,而是真·游戏级3D与近期热门的WorldLabs的Marble(基于GaussianSplatting)或GoogleDeepMind的Genie3(生成交互式视频流)不同,WorldGen输出的是标准的三角网格(trimesh):兼容Unity、Unreal等传统游戏引擎;包含完整的导航网格(navmesh),支持角色碰撞检测与NPC自主导航;场景由真实3D资产构成,而非视觉近似体。Meta将其描述为:"一个端到端的先进系统,通过单一文本提示生成可交互、可导航的3D世界,服务于游戏、仿真与沉浸式社交环境。"四步生成流程:从文本到可玩世界据Meta披露,WorldGen的生成流程分为四大阶段:(1)规划阶段(Planning)程序化生成基础布局(blockout)提取导航网格(navmesh)生成参考图像指导后续重建(2)重建阶段(Reconstruction)图像到3D基础模型生成基于navmesh构建完整场景结构初步纹理生成(3)分解阶段(Decomposition)使用加速版AutoPartGen提取场景部件(如门、窗、家具)对部件数据进行清洗与结构化(4)精修阶段(Refinement)图像增强网格细节优化高质量纹理贴图生成整个过程融合了程序化生成、扩散模型、场景理解与几何优化,形成一条完整的AI世界生产管线。为何还不上线?两大瓶颈待解尽管技术惊艳,Meta明确表示WorldGen暂不会集成到当前的HorizonWorldsDesktopEditor,也不会作为即将推出的HorizonStudio的首发功能。原因有二:空间尺寸受限:目前仅能生成50×50米的区域,对于开放世界而言太小;生成速度慢:从文本到完整世界仍需较长时间,无法满足创作者"秒级迭代"需求。Meta正在全力优化这两点,目标是在2026年推出大幅升级版,以兑现其在Connect2025大会上展示的HorizonStudio愿景--一个拥有AI助手的全能创作平台,可即时生成:完整世界定制化资产具备行为逻辑的NPC特定玩法机制⚠️但当时演示的内容,可能更多是"概念原型",而非已部署的技术。HorizonWorlds创作现状:DesktopEditor已支持部分AI功能目前,创作者可通过HorizonWorldsDesktopEditor进行flatscreen开发:导入3D模型、贴图、音频;使用TypeScript编写游戏逻辑;在美国、英国、加拿大、欧盟、澳大利亚、新西兰等地区,还可调用AI生成:3D网格资产纹理与天空盒音效与环境音TypeScript代码片段但完整世界生成,仍需等待WorldGen成熟。展望随着AI3D生成技术指数级演进,Meta很可能在2026年实现其"人人都是世界建筑师"的承诺。届时,HorizonStudio或将成为首个真正意义上的AI驱动元宇宙创作平台--你只需说:"创建一个赛博朋克夜市,有霓虹招牌、雨天街道、可互动的机器人摊贩",系统便在几分钟内交付一个可多人游玩的完整VR世界。而WorldGen,正是通往这一未来的基石。

  • World Labs 发布 Marble:一张图或一句话,几分钟生成可交互3D场景

    2025-11-25

    由人工智能先驱李飞飞(Fei-FeiLi)于去年创立的初创公司WorldLabs,近日推出其首款产品--Marble。这款生成式AI模型能将单张图片、一段文字,甚至短视频,在短短几分钟内转化为可在WebXR中直接浏览的体素化3D场景,为VR/AR内容创作带来前所未有的效率革命。从ImageNet到"世界模型":李飞飞的新征程作为2010年代推动计算机视觉爆发的关键人物,李飞飞因创建ImageNet数据集而广为人知--她敏锐地意识到:高质量标注数据的缺失,才是AI进步的最大瓶颈。如今,她将这一理念延伸至三维空间,带领WorldLabs打造所谓"首类生成式多模态世界模型"(first-in-classgenerativemultimodalworldmodel)。Marble的核心技术基于近年主流的3DGaussianSplatting(高斯泼溅)技术--通过在三维空间中排布成千上万个半透明彩色"高斯点",实现实时、任意视角的逼真渲染。但与其他系统相比,Marble在输入灵活性与生成速度上实现了显著突破。单图秒变3D?Marble的能力边界免费模式:仅需一张图片或一段文本提示,几分钟内即可生成可浏览的3D场景;付费订阅(20美元/月):支持多图输入、短视频、甚至粗略3D结构,并通过名为Chisel的编辑工具进行深度创作。Chisel允许用户像使用游戏引擎一样,在场景中放置简单几何体(如立方体、球体),再用自然语言指令(如"把这里变成热带雨林")将其转化为细节丰富的体素环境。更关键的是,付费用户还能:对生成场景进行交互式编辑与扩展;合并多个世界构建复杂空间;导出为传统3D网格(mesh),用于Unity、Unreal等引擎开发(转换需数小时)。所有生成内容均可通过WebXR在Quest3、AppleVisionPro等设备的浏览器中直接查看,无需安装专用应用。实测体验:快,但仍有局限在实际测试中(例如将一张2014年SteamDevDaysVR会场照片输入Marble),生成场景的质量明显低于Meta的HorizonHyperscape或VarjoTeleport,大致介于NianticScaniverse之上、专业扫描之下。主要问题在于:画面中心区域(对应原图内容)细节尚可;边缘及背面区域则依赖AI"脑补",出现典型高斯泼溅的模糊、扭曲或结构失真;若仅用单图输入,相机视野外的内容纯属幻觉,与真实环境可能大相径庭。📌因此,若追求高保真重建,仍需提供多角度图像或视频。为何Marble依然值得期待?尽管存在画质限制,Marble的真正价值在于"快速原型+语义驱动创作":游戏开发者可用它几分钟内搭建关卡雏形;教育者能将历史照片转为可探索的3D课堂;社交VR创作者可通过自然语言"描述梦境",即时生成虚拟聚会空间。结合Chisel的几何可控性与自然语言接口,Marble正在模糊"内容消费者"与"世界建造者"之间的界限。使用须知官网地址:marble.worldlabs.ai免费账户生成的场景默认公开;私有场景、高级编辑与导出功能需订阅20美元/月计划。

  • SAM 3D:Meta 重塑视觉计算——一张照片生成3D世界

    2025-11-21

    在空间计算浪潮席卷全球之际,Meta正式推出SegmentAnythingModel3D(SAM3D),将传统的2D图像理解能力推向全新维度。这项突破性技术仅需单张普通照片,即可精准重建出完整的3D物体、场景甚至人体模型,让每一帧手机快照或网络图片瞬间转化为可交互、可部署的沉浸式数字资产。从平面到空间:打破屏幕的牢笼过去数十年,我们的数字生活被禁锢在二维屏幕上--点击、滑动、观看,却始终与物理世界隔绝。SAM3D正在瓦解这一边界:一张椅子的照片不再只是静态图像,而是一个可360°旋转、自由缩放、导入虚拟房间的真实3D对象;一个人物快照也能变成可用于社交Avatar或全息通信的立体化身。Meta已率先将该技术落地于FacebookMarketplace的"ViewinRoom"功能。用户不再需要凭空想象沙发尺寸是否合适,而是直接将其3D模型"放置"在自家客厅中,从任意角度查看搭配效果--电商体验由此迈入空间化时代。直面真实世界的复杂性传统3D重建常因遮挡、杂乱背景或多视角缺失而失败。SAM3D却能从容应对这些现实挑战:即使物体部分被遮挡,系统仍可推断完整结构;在凌乱环境中精准分离目标主体;支持非正面、低光照等"不完美"输入。其背后依托超大规模预训练模型与人在回路(human-in-the-loop)反馈机制,在保证高精度的同时实现接近实时的推理速度,为消费级应用和创意工作流提供坚实支撑。赋能XR、机器人与下一代交互SAM3D的意义远超图像处理本身,它正在催生多个领域的范式变革:AR/VR内容创作民主化:无需建模技能,拍照即得3D资产;虚拟零售革命:商品数字化成本骤降,沉浸式购物成为标配;空间通信新形态:未来视频通话或将传送3D化身而非2D画面;机器人环境理解:帮助机械臂更准确识别与操作现实物体。开源驱动生态,加速3D普及Meta延续其开放策略,同步开源了SAM3D的模型权重、评估基准与开发者工具包,并上线了直观易用的在线Playground。全球开发者、设计师、教育者均可立即上手实验,共同推动从"2D屏幕时代"向"动态3D世界"的主流迁移。SAM3D如何改变你的数字生活?一键生成3D:手机照片秒变精细3D模型零门槛创作:普通人也能制作XR内容重塑电商体验:家具、服饰"试穿试摆"更真实赋能硬件生态:为XR眼镜、MR设备提供实时3D引擎激发全球创新:通过开源持续推动技术演进在Playground中测试Sam3Dhttps://aidemos.meta.com/segment-anything/gallery

  • 免费工具PimaxMagic4All为大量SteamVR游戏添加眼动追踪注视渲染

    2025-11-19

    一款名为PimaxMagic4All的免费工具现已推出,专为配备现代NvidiaGPU的WindowsPC设计,能够为众多SteamVR游戏添加眼动追踪注视渲染(Eye-TrackedFoveatedRendering,ETFR)。该工具重现了Pimax在其PimaxPlay软件中提供的功能,因此如果你已经拥有Pimax头显,则无需使用此工具。支持设备广泛,涵盖主流高端VR头显PimaxMagic4All兼容任何通过低级公共API公开眼动追踪数据的SteamVR兼容头显,或通过第三方软件实现此功能的设备,包括但不限于:MetaQuestPro(需借助SteamLink或VirtualDesktop)PlayStationVR2(需PSVR2Toolkit)SamsungGalaxyXR(需VirtualDesktop)PlayForDreamMR(需VirtualDesktop)VarjoAero什么是注视渲染?固定注视渲染(FFR):图像中心区域以更高分辨率渲染,而周边区域则降低分辨率。眼动追踪注视渲染(ETFR):根据眼动追踪传感器确定当前视线焦点,并仅对该区域进行高分辨率渲染。这两种技术均能显著提升VR性能表现,既可用于提高高负载场景下的帧率流畅度,也可在已达到目标帧率的情况下进一步提升最高分辨率。与FFR相比,ETFR理论上不会产生明显的边缘像素化现象,前提是眼动追踪系统的延迟足够低。开发者MatthieuBucchianeri表示,该工具"可能"也适用于Valve的SteamFrame,尤其是在从安装NvidiaGPU的WindowsPC串流时。此外,理论上经过适当开发调整后,它也可能支持HTCViveProEye和ViveFocusVision。开发者背景及工具特点Bucchianeri是一位经验丰富的开发者,曾参与过PS4、初代PlayStationVR、SpaceXFalcon9和Dragon项目以及微软HoloLens和WindowsMR的研发工作。目前他在微软Xbox团队贡献于OpenXR,并利用业余时间开发了多个开源项目,如OpenXRToolkit、VDXR(VirtualDesktop的OpenXR运行时)以及最新推出的Oasis--这一原生SteamVR驱动程序成功复活了WindowsMR头显。PimaxMagic4All提供了一个简洁的图形界面,内置三种注视渲染模式:最大、平衡和最小,用户可根据需求选择侧重性能提升、视觉效果无差异或两者间的平衡。使用条件及兼容性说明该工具可注入任何使用DirectX11图形API和OpenVRAPI的游戏,但不适用于含有反作弊系统的游戏,因为这类系统会阻止代码注入。同时,必须配备NvidiaGTX16系列或RTX显卡才能正常运行。在GitHub项目的Wiki页面上列出了部分支持的游戏列表,包括《Half-Life:Alyx》、《SkyrimVR》、《Fallout4VR》等知名作品,但这只是理论上应支持的庞大游戏库的一小部分。值得注意的是,《MicrosoftFlightSimulator2024》、《DCS》和《iRacing》三款游戏已原生支持OpenXR眼动追踪注视渲染,因此无需额外安装PimaxMagic4All。PimaxMagic4All现已上线GitHub,提供了基于Pimax核心代码的源码以及编译版本供用户下载。

  • 不用专业设备,手机+浏览器即可:开源技术Gaussian-VRM重塑数字身份

    2025-10-27

    在2025年大阪・关西世博会备受瞩目的标志性展馆「null²」中,一项名为「MirroredBody®(镜像身体)」的体验让参观者得以在数字世界中与自己的虚拟分身相遇。支撑这一沉浸式体验的核心技术--Gaussian-VRM,近日已正式在GitHub上开源,高保真3D虚拟化身的生成门槛正被大幅拉低。这项技术由筑波大学博士课程的近藤生也主导开发,其核心亮点在于:仅需智能手机拍摄,即可在极短时间内生成高质量3D虚拟形象。相关成果已发表于论文《InstantSkinnedGaussianAvatarsforWeb,MobileandVRApplications》。与传统依赖专业设备或复杂流程的方案不同,Gaussian-VRM采用当前热门的高斯溅射(GaussianSplatting)技术,在保证画质的同时实现了惊人的处理速度。30秒生成,全流程浏览器内完成用户只需使用支持的智能手机应用(如Scaniverse)对全身进行扫描,系统约30秒内即可完成3D建模。整个流程--从扫描、生成到动画展示--均可在浏览器环境中完成,无需安装任何专业软件。这一"端到端"的轻量化设计,极大降低了普通用户和开发者的使用门槛。为实现高效的跨平台应用,团队开发并采用了基于通用虚拟形象格式VRM的专属便携式格式「Gaussian-VRM(.gvrm)」。该格式支持通过JavaScript进行动作控制,便于集成至Web应用、移动应用及VR内容中,真正实现了从生成到应用的全链路闭环。参考GitHub:https://gaussian-vrm.github.io 论文:https://arxiv.org/abs/2510.13978

  • 三星Galaxy XR:以“真·开放”挑战XR生态格局

    2025-10-26

    在XR设备领域,平台开放性正成为继硬件性能之后的又一关键竞争维度。三星GalaxyXR的发布,为这场关于生态控制权的博弈投下了一枚重磅炸弹--它可能是目前三大主流独立式XR平台中最开放的一个。与苹果的visionOS和Meta的HorizonOS相比,GalaxyXR在用户自由度上展现出显著优势。visionOS完全禁止应用侧载(sideloading),仅允许开发者通过Mac上的Xcode编译应用进行测试。而Meta的HorizonOS虽支持侧载,但流程繁琐:用户必须注册开发者身份,提供手机号或支付卡信息完成验证,并通过PC连接设备才能实现应用安装。相比之下,GalaxyXR的体验则简洁得多。据VR52网实测确认,用户无需开启开发者模式,也无需连接PC,即可直接在设备内置的Chrome浏览器中下载AndroidAPK文件并完成安装。只要在"设置-安全与隐私"中授予浏览器"安装未知应用"的权限,整个过程便畅通无阻。开放不止于侧载:可解锁的引导程序更进一步的是,据某科技博主首次公开指出,GalaxyXR似乎允许用户解锁引导程序。这意味着从理论上讲,开发者可以刷入定制操作系统,实现更深层次的系统级改造。尽管目前尚无通用的独立式XR操作系统可供替换,且驱动兼容性等问题仍构成技术壁垒,但这一可能性为未来社区驱动的开源项目打开了大门。最现实的路径可能是基于设备现有的AndroidXR系统进行深度定制。此类项目的动向值得持续关注。"AndroidofXR"的名号之争MetaCEO马克·扎克伯格及其高管团队曾多次将HorizonOS称为"XR领域的Android",强调其相对于visionOS的开放性。然而,当真正的AndroidXR平台--由谷歌主导、搭载于三星GalaxyXR之上--正式亮相后,这一说法显得颇具讽刺意味。事实证明,谷歌自家的XR平台在开放性上,反而远超Meta的"类Android"系统。开放性之外:厂商支持才是胜负手长远来看,决定谁能成为苹果VisionPro之外主流替代方案的关键,或许并非平台开放程度,而是制造商的采纳意愿。目前,华硕(Asus)和联想(Lenovo)正基于HorizonOS开发XR设备,而Xreal、Lynx和索尼则选择了AndroidXR平台。当市场同时提供价格亲民的AndroidXR设备与高端定位的HorizonOS产品,硬件差异逐渐模糊时,用户将如何选择?届时,平台的开放性差异是否会成为影响决策的核心因素?这个问题,或许将在未来几年的答案中重塑XR生态的权力结构。

  • Unity 正式支持 Android XR,Unity 6 起全面赋能新一代VR应用开发

    2025-10-22

    2025年10月22日,Unity宣布从最新版本Unity6起,正式推出对AndroidXR平台的通用支持。这一更新意味着全球开发者现已能够在Unity引擎中,为包括三星GalaxyXR在内的下一代AndroidXR设备开发沉浸式应用与内容,标志着Unity在跨平台XR开发生态中的进一步扩展。自AndroidXR进入早期开发阶段以来,Unity已持续提供技术支持,并积极参与生态共建。此次正式支持不仅允许开发者快速构建全新的XR应用与游戏,还显著降低了迁移成本--现有的Unity项目可便捷地移植至AndroidXR生态系统,加速内容落地。深度整合Google工具链,覆盖多元应用场景Unity表示,已与Google紧密合作,将AndroidXR相关开发工具提前集成至Unity6中,优化了底层兼容性与性能调校。此举旨在为游戏、教育、娱乐、工业培训等多个领域提供稳定、高效的开发环境,推动高质量沉浸式体验的规模化落地。目前,已有多个基于Unity开发的GalaxyXR发售首发应用亮相。其中包括:Google推出的「GoogleMapsonAndroidXR」,将地图导航体验带入空间计算场景;StatusPROInc开发的「NFLProEra」,以沉浸式方式呈现美式橄榄球训练与战术分析;经典VR工作室OwlchemyLabs(代表作《JobSimulator》)带来的新作「Inside[JOB]」,延续其标志性的幽默交互风格。这些作品共同展示了Unity+AndroidXR在消费级与专业级应用中的广泛潜力。

  • Meta浏览器升级:WebXR无需场景扫描即可放置虚拟物体

    2025-10-11

    Meta旗下Horizon浏览器最新版本(40.4)已正式上线,为Quest3与Quest3S设备带来一项关键升级:WebXRHitTesting(命中检测)功能现已基于深度感知技术实现,无需依赖传统的"场景网格"(SceneMesh),即可在网页环境中完成混合现实(MR)虚拟物体的即时放置。这一更新意味着用户在浏览支持WebXR的网页内容时,能够更快速、更自然地将虚拟对象锚定在现实世界的表面--例如将一个3D模型放在桌面或墙上--而无需预先完成房间扫描。从静态建模到实时感知:HitTesting的技术演进WebXRHitTestingAPI是WebXR开放标准的一部分,允许开发者从某个起点(如用户的头部或控制器)发射一条"概念射线",检测其与真实世界几何体的首次交点,从而确定虚拟物体的放置位置。过去在Quest3系列设备上,该功能依赖于混合现实设置过程中生成的"场景网格"进行射线碰撞检测。然而,这一方式存在明显局限:若用户尚未为当前空间生成场景网格,则必须先完成扫描流程,显著增加了使用门槛;即便已有网格,也无法反映家具移动或环境变化后的实时状态,导致虚拟物体放置错位。深度API驱动:实现动态环境感知此次更新的核心在于,HorizonBrowser40.4版本已将HitTesting的底层技术从场景网格切换为Meta的深度API(DepthAPI)。该API通过计算机视觉算法,分析设备前置双追踪摄像头之间的视差,实时生成第一人称视角的深度帧数据,有效距离约为5米。深度API此前已被广泛用于实现混合现实中的动态遮挡效果--即判断虚拟物体是否应被真实物体遮挡。如今,这一能力被引入网页端,使WebXR应用能够直接利用实时深度信息进行命中检测,从而实现"即开即用"的虚拟物体放置体验。开发者生态的进一步统一事实上,这一功能早已向原生应用开发者开放。Unity开发者可通过Meta的混合现实工具包(MixedRealityUtilityKit,MRUK)轻松集成,Unreal及原生应用开发者也可直接调用深度API实现类似效果。此次更新标志着网页端开发者终于获得了同等能力,进一步缩小了WebXR与原生应用在功能体验上的差距。值得注意的是,当前基于深度API的命中检测更适合用于放置静态、简单的虚拟对象或界面元素。若虚拟实体需要在表面移动或与房间其他部分进行复杂交互(如物理碰撞),仍需依赖完整的场景网格扫描。

  • 人类扩展白皮书发布:四大维度勾勒未来人机融合图景

    2025-10-10

    2025年10月7日,人类扩展联盟(HumanAugmentationConsortium)正式发布《人类扩展联盟白皮书--人类扩展技术开拓的未来场景》。该联盟致力于推动人类扩展技术的发展,以应对社会挑战。此次发布的白皮书旨在促进社会各界对"人类扩展技术"形成统一认知,系统梳理了技术框架、应用场景及潜在挑战。联盟成立于2024年12月,是日本内阁府主导的国家项目"战略性创新创造计划(SIP)第三期"的组成部分。截至2025年10月,已有17家企业和机构、5名个人会员加入,正逐步构建跨领域协作的创新生态。四大扩展维度:重新定义人的能力边界白皮书首次将人类扩展技术划分为四大类别:身体能力、知觉、认知、存在,为技术发展提供了清晰的框架。身体能力扩展:通过外骨骼、义肢、动力辅助服等增强肌肉力量与运动机能。知觉扩展:突破人类五感极限,如增强视觉感知范围、提升听觉灵敏度或引入新型感官反馈。认知扩展:借助脑机接口或AI辅助系统,提升记忆力、注意力、决策力与学习效率。存在扩展:利用元宇宙、远程操控、数字分身等技术,突破物理时空限制,实现"身临其境"的远程存在。支撑这四大扩展的技术要素包括:元宇宙等云应用平台、通用技术平台、各类硬件设备(传感器、控制器、手套、头显等),以及作为核心的"用户"本身。白皮书特别强调,用户是扩展的主体,技术设计必须以人为本。企业实践前沿:从运动辅助到感知共享白皮书中展示了多家会员企业的具体实践案例,凸显技术落地的多样性。美津浓(Mizuno)推出了用于运动员的高性能义足弹簧板,并开发了可减轻体力负担的"美津浓动力辅助服"。此外,其"MotionDNA"系统能科学分析步行姿态,为个性化身体增强提供数据支持。NTTDocomo则构建了名为"人类扩展基盘"的平台,能够吸收人与人、人与机器人之间的身体数据与感官差异,实现动作与感知的共享。该技术有望应用于远程协作、虚拟共演等场景,推动"感同身受"的交互体验。除此之外,白皮书还收录了医疗、制造、教育、娱乐等多个领域的应用案例,展现了人类扩展技术的广泛适用性。构建生态:从技术验证到国际标准未来,联盟将通过技术验证项目、推动国际标准制定、举办专题研讨会等方式,加速人类扩展技术的生态构建。白皮书内容也将根据联盟内部讨论及外部利益相关者的反馈,持续更新迭代。随着技术的演进,伦理、法律与社会影响(ELSI)问题日益凸显。白皮书系统梳理了隐私、公平性、身份认同、责任归属等关键议题,为政策制定与社会对话提供了重要参考。

  • Meta自研Horizon Engine首曝:告别Unity,能否重塑元宇宙入口?

    2025-10-05

    Meta自主研发的HorizonEngine首次披露核心技术架构,标志着其在构建元宇宙底层能力上的关键一步。该引擎在Connect2025大会亮相后,被确认将全面取代Unity,成为HorizonWorlds以及Quest新版沉浸式主界面(ImmersiveHome)的核心动力。目前,新版沉浸式主界面已随HorizonOSv81推送,但仅限于公共测试频道(PTC)用户;而HorizonWorlds中的HorizonEngine支持则依赖即将上线的HorizonStudio,现阶段仅限Meta自研的少数官方世界使用。尽管CEO扎克伯格在发布会上宣称,该引擎为"从零构建",可实现世界加载速度提升4倍、单实例支持超百名用户,但当时并未透露具体技术细节。如今,Meta通过官方博客首次系统性地公开了HorizonEngine的核心模块设计。从云端到移动端:跨平台渲染与资源调度Meta强调,HorizonEngine具备"从高端云端渲染到移动端运行"的自动适配能力。这意味着同一套引擎可在不同性能设备上动态调整表现,兼顾视觉质量与运行效率。引擎支持"单共享空间内大规模实时虚拟形象聚集"、可流式加载的广阔环境(以子关卡形式),并通过自动生成的LOD(细节层次)系统自动管理对象质量。这一特性背后,是资源管理模块的深度优化:引擎内置资源管理器、流式加载系统和多线程任务调度框架,能够在Quest及其他平台的性能波动范围内,动态平衡画质与成本,保障用户体验的稳定性。核心技术栈解析:模块化与创作者友好Meta详细拆解了HorizonEngine的八大核心系统,展现出其对性能、扩展性与创作效率的综合考量:资产系统:采用数据驱动、创作者可控的资产管线,兼容主流工具链,包括PopcornFX(特效)、FMOD(音频)、Noesis(UI)和PhysX(物理)等成熟中间件,降低创作门槛。音频系统:集成空间化音频,将场景音效、沉浸式媒体格式与混合式语音通话(VoIP)无缝融合,构建统一的听觉沉浸体验。虚拟形象系统:深度集成MetaAvatars,确保跨平台化身表现与交互行为的一致性,并支持跨实例的联网人群系统。网络架构:基于"角色"(actor)的可扩展、安全网络拓扑,结合服务器验证与低延迟的玩家预测交互,允许创作者自定义网络化组件,提升多人互动的流畅性。渲染系统:面向移动设备与VR优先的前向渲染器,具备基于物理的着色模型、内置光照烘焙工具、探针定义的动态光照,以及通过可扩展、可堆叠表面着色器系统实现的创作者自定义材质框架。脚本系统:采用可扩展的TypeScript开发环境,统一世界中的逻辑与控制流,支持自定义组件与清晰的实体生命周期管理。模拟系统:基于数据导向的ECS(实体-组件-系统)架构,可高效模拟数百万个联网实体,为大规模互动场景提供底层支持。移动端原生渲染的潜在战略转向一个值得注意的细节是,Meta明确提到引擎"可在手机上运行"。目前,手机端的HorizonWorlds依赖云端串流,不仅对用户网络要求高,也给Meta带来显著的运营成本。若未来转向手机端原生渲染,不仅能大幅提升响应速度与稳定性,还能显著降低服务成本。这一转变或将增强Meta在社交游戏领域的竞争力,使其更直接地对标《堡垒之夜》(Fortnite)和《Roblox》等跨平台创作生态。通过自研引擎掌控全栈技术,Meta正试图摆脱对第三方引擎的依赖,在元宇宙入口的争夺中掌握更多主动权。

  • Meta 推出可穿戴设备接入工具包,允许开发者为其智能眼镜开发应用程序

    2025-09-19

    在MetaConnect2025大会后续更新中,Meta宣布将于今年晚些时候推出WearableDeviceAccessToolkit(可穿戴设备访问工具包),这是一套面向开发者的SDK,旨在让第三方智能手机应用首次直接与Meta智能眼镜(如Ray-BanMeta、OakleyMeta系列等)的硬件功能进行交互。开发者将能访问哪些功能?在初始版本中,该工具包将允许开发者通过用户的智能手机应用,安全地访问智能眼镜的以下核心组件:摄像头(用于拍照、录像或实时图像流)扬声器(用于音频播放或语音反馈)麦克风阵列(支持空间音频采集与语音识别)所有权限均需用户明确授权,每款应用必须在使用前获得用户许可,确保隐私可控。实际应用场景:从直播到AI分析Meta表示,这一SDK将为开发者打开全新的交互可能性。例如:在健身类App中集成第一人称视角直播或录制功能;将眼镜拍摄的实时画面传输至第三方多模态AI模型,实现"你看到什么,AI就分析什么"--比如识别物体、翻译文字、获取商品信息等。值得注意的是,首发版本暂不支持调用Meta自家的MetaAI。这意味着开发者若想构建AI驱动体验,必须:建立持续的音视频数据流;将图像发送至自有的或第三方AI模型;承担相应的计算成本与带宽开销;面对由此带来的额外电池消耗问题。Meta明确表示,集成MetaAI支持是该工具包未来更新的"关键方向"。不支持的功能:显示与手势控制暂未开放目前,该SDK不支持以下高级功能:向MetaRay-BanDisplay的HUD(抬头显示器)发送图像内容;访问MetaNeuralBand的手势识别数据。不过,Meta已确认正在探索这些能力的未来可行性,为更深层次的AR交互预留了技术路径。先行实验:Twitch、微软、18Birdies已在测试早在数月前,Meta已向部分合作伙伴提供了早期版本的工具包,包括:Twitch与LogitechStreamlabs:用于在直播平台中实现第一人称视角直播,功能类似当前Instagram上的支持;MicrosoftSeeingAI:帮助视障人士通过眼镜摄像头实时感知环境,如识别文本、人物、物体和货币,提升独立生活能力;18Birdies(高尔夫应用):正在测试利用眼镜摄像头进行实时距离测算与球杆推荐,让球员无需掏出手机即可获得战术建议,极大提升球场体验。开发者可申请预览版有兴趣的开发者现已可通过Meta官方表单申请加入WearableDeviceAccessToolkit预览计划,提前探索其潜力。从封闭到开放,Meta智能眼镜生态迈出关键一步此前,Meta智能眼镜的功能主要局限于自有生态系统(如MetaAI、WhatsApp、Instagram)。此次推出SDK,标志着Meta正式向第三方开发者敞开大门,推动眼镜从"Meta生态配件"向"可编程可扩展的通用可穿戴平台"演进。虽然初期功能有限且缺乏MetaAI深度集成,但这一工具包为未来的创新奠定了基础:想象一下导航App主动提醒你转弯、购物App自动比价、学习App即时翻译课本--智能眼镜,正逐步成为真正的"全天候个人助理"。

  • Meta 全面重构 Horizon 世界:新自研引擎上线,更快的加载速度和最多 100 个并发用户

    2025-09-18

    在今日的MetaConnect2025大会上,Meta宣布对旗下社交元宇宙平台HorizonWorlds进行一次根本性技术升级--推出全新自研的HorizonEngine,正式取代此前基于Unity构建的技术底座。这一变革不仅将加载速度提升至原来的四倍,更将单场景用户容量从20人跃升至100人,标志着HorizonWorlds正式迈入"大规模社交VR"时代。告别Unity:为"互联世界"而生的专属引擎过去,HorizonWorlds依赖Unity引擎开发,虽具备成熟的工具链,但在跨场景跳转、大规模用户同步和性能优化上始终受限。此次推出的HorizonEngine是Meta首次为Horizon平台量身打造的专属引擎,其核心设计目标明确:实现无缝跳转的互联社交空间。Meta强调,新引擎针对"空间间快速切换"进行了深度优化,加载速度提升4倍。这意味着用户在不同世界之间穿梭时,等待时间大幅缩短,体验更接近现实中的"推门即入",而非传统VR中常见的"黑屏加载"。更重要的是,性能的全面提升使得单个世界可容纳的并发用户数达到100人,是此前上限(20人)的五倍。这一变化将显著改变社交互动的规模与形式--从私密小聚到大型虚拟派对、线上发布会、演唱会等公共活动,HorizonWorlds的应用场景被进一步拓宽。HorizonHome重构:向"统一入口"迈进作为用户戴上Quest头显后的默认起点,HorizonHome也已全面迁移至新引擎。此次重构不仅带来了视觉质量的提升,更引入了多项功能性改进:用户可将常用应用"钉"在虚拟墙壁上,实现快速访问;更重要的是,现在可以将通往不同HorizonWorlds空间的"传送门"直接固定在Home环境中,形成个性化快捷入口。这一变化被外界视为Meta正在推动HorizonHome与HorizonWorlds深度融合的重要信号。两者如今运行在同一技术架构之上,边界正逐渐模糊--Home不再只是一个启动界面,而正演变为一个真正意义上的"虚拟生活枢纽"。创作者革命:MetaHorizonStudio以"对话"构建世界除了底层引擎的升级,Meta还发布了面向创作者的全新工具--MetaHorizonStudio,一个基于"智能代理"(agentic)理念的AI编辑器。与此前推出的AI资产生成工具不同,HorizonStudio将多种创作功能整合进一个基于自然语言的聊天界面。创作者无需编写代码或操作复杂界面,只需用日常语言提出需求,系统即可自动执行。例如:"把场景风格改成科幻风""添加一个会说话的熊角色,它迷路了,需要玩家帮助回家"这类指令将由AI理解并转化为具体的场景修改、角色生成与行为逻辑设定。Meta表示,这将极大降低内容创作门槛,让更多非专业用户也能参与虚拟世界的构建。该工具预计将在不久后推出Beta版,未来或将成为Horizon生态内容爆发的关键推手。技术重构背后,是Meta对"社交元宇宙"的再定义此次HorizonEngine的发布,远不止一次性能优化。它代表了Meta对Horizon平台战略的重新锚定:从"多个孤立的VR小游戏集合",转向"一个连贯、可扩展、高并发的互联虚拟社会"。通过自研引擎掌控技术栈、提升用户体验、重构入口逻辑、赋能创作者生态,Meta正在下一盘更大的棋。虽然HorizonWorlds仍面临用户增长与内容质量的挑战,但这次全面技术升级,无疑为其未来三年的发展打下了坚实基础。真正的"元宇宙"或许还很遥远,但至少现在,你可以在一个百人同屏、秒速加载的世界里,和朋友一起建造属于你们的虚拟家园。

  • 抛弃手柄:Owlchemy为何押注“纯手部追踪”VR

    2025-09-04

    在VR交互演进的十字路口,OwlchemyLabs正坚定地押注一个方向--徒手操作。这家以《工作模拟器》《度假模拟器》等作品定义VR交互标杆的开发商,近年来持续推动手部追踪技术的落地。其最新作《DimensionalDoubleShift》甚至完全摒弃控制器,成为一款仅支持手部追踪的VR游戏。这一选择并非偶然,而是源于对用户行为与技术趋势的深度观察。手部追踪:通往大众化的核心路径OwlchemyLabs认为,手部追踪是当前实现VR最广泛吸引力的关键。相比需要学习按钮布局的控制器,徒手交互更直观、门槛更低,尤其对新用户而言,无需额外设备即可"伸手即玩",大幅降低了进入虚拟世界的摩擦。这一判断正被市场验证:Steam已为手部追踪提供实验性支持,PlayStationVR2也在今年迎来了首批支持该技术的游戏。而Owlchemy自家的前作《工作模拟器》与《度假模拟器》在发售后也陆续通过更新加入了手部追踪功能,顺应了用户对自然交互的日益增长的需求。技术壁垒仍在:PSVR2的跨平台困境尽管趋势明确,但手部追踪的全面普及仍面临挑战。目前,《工作模拟器》或《度假模拟器》短期内不会登陆PSVR2并支持手部追踪。原因在于Unity引擎尚未提供对PSVR2手部追踪的原生支持,开发者必须依赖第三方中间件方案--这不仅开发成本高昂,也增加了技术复杂性。这一现实揭示了当前VR生态的割裂:即便开发者有意推进,平台底层支持的缺失仍是跨设备体验统一的重大障碍。新一代"VR原住民"正在崛起真正让Owlchemy看到未来的,是Z世代末期与Alpha世代初期用户的崛起。这批成长于触屏、手势交互和社交游戏环境中的年轻人,天生习惯"用手直接操作"的数字体验,对VR的自然交互接受度极高。以《DimensionalDoubleShift》为例,其测试版原定目标下载量为2万,最终突破20万,并持续保有稳定的月活跃用户。这与传统2D游戏中"上线即巅峰,随后断崖式下滑"的现象截然不同,显示出VR社交体验的长期粘性。呼唤硬件厂商的勇气Owlchemy指出,当前VR生态正面临一个关键机遇:整整一代"VR原住民"正等待被接入虚拟世界。但能否抓住这一代际窗口,取决于头显制造商是否愿意真正投入资源,优化自然交互体验,降低使用门槛。当手部追踪不再是"附加功能",而是VR设备的默认交互方式,虚拟现实才有可能从极客圈层走向主流大众。而OwlchemyLabs,早已为这一未来铺好了第一块砖。

  • Meta Connect 2025前瞻:智能眼镜SDK或将亮相,开启AI可穿戴新阶段

    2025-09-01

    距离MetaConnect2025大会不到三周,议程已透露关键信号:Meta或将推出智能眼镜相关的SDK,迈出构建AI可穿戴生态的重要一步。大会第二天有三场开发者会议明确提到"9月18日将发布Meta全新开发者工具包",措辞一致,暗示这是一次系统性的开发接口开放。三位主讲人的背景也高度聚焦:LansingLee是Meta产品经理,专注于推动应用向Ray-BanMeta等AI眼镜迁移;ValentinaChacónBuitrago曾参与Meta的SparkAR平台,显示AR技术正被复用于新硬件;ConorGriffiths则负责Ray-Ban和Oakley眼镜的外部软件集成,并主导第三方为Meta未来可穿戴设备开发AR与AI内容。三人角色的共性,清晰指向Meta正在为智能眼镜构建开发者生态。开发者生态的提前布局这一发现恰逢CNBC的报道:Meta已开始接触第三方开发者,邀请他们为即将推出的、配备sEMG神经腕带的HUD智能眼镜开发"实验性应用"。报道特别指出,Meta优先选择"专精生成式AI"的开发者,意图明显--这些应用将作为产品发布时的核心卖点,用于展示设备能力。然而,一个核心问题依然悬而未决:这个SDK究竟会以何种形式存在?目前的Ray-BanMeta与OakleyMetaHSTN眼镜计算能力极为有限,更接近Fitbit而非智能手机或XR头显。Meta首席技术官AndrewBosworth曾多次强调,正是这种算力限制,导致无法提供传统的设备端SDK。SDK的两种可能路径基于现有信息,SDK的发展方向存在两种可能性。其一,是服务器端SDK。开发者并非为眼镜本身开发应用,而是为MetaAI构建集成能力,类似于亚马逊的AlexaSkills模式。用户通过语音或手势触发,由云端AI处理并返回结果,再通过眼镜呈现。这种模式规避了本地算力瓶颈,但功能深度受限于AI服务本身。其二,是面向新一代HUD眼镜的本地化SDK。据多方信源(包括TheVerge、TheInformation、FinancialTimes及Bloomberg的MarkGurman)报道,Meta正秘密推进代号"Hypernova"的智能眼镜项目。这款设备将在单眼中集成微型抬头显示(HUD),用于显示时间、天气、通知、实时语音字幕与翻译,以及MetaAI的文本回复--尽管并非传统意义上的AR,但已具备基础情境感知能力。Hypernova:Meta下一代可穿戴的关键拼图Hypernova的重量据报约为70克,显著重于当前Ray-BanMeta的50克,这一差异很可能源于HUD模组与更强算力芯片的加入。更关键的是,其交互方式将依赖Meta长期研发的sEMG神经腕带,通过手指微动作实现精准控制。Gurman指出,该腕带将随设备附赠。今年7月,早期固件中泄露的渲染图不仅证实了设备与腕带的设计,更在一个刻字细节中暗示了产品正式名称--MetaCeleste。正因Hypernova具备显示能力与来自腕带的丰富输入,其本地算力很可能远超现款眼镜。若其定价在800美元左右,也意味着Meta愿意为更强性能付出成本,这为本地SDK的可行性提供了支撑。未来生态的融合可能当然,最有可能的路径是两者的结合:SDK既支持云端AI能力扩展,也开放部分本地功能接口,形成"云-端协同"的开发框架。开发者可选择将AI服务作为后端,通过眼镜与腕带实现自然交互,最终在HUD上呈现结果。这种架构既能发挥MetaAI的优势,又能利用新硬件的交互潜力。MetaConnect2025即将拉开帷幕,届时UploadVR将带来全部重磅发布的完整报道。而这场大会,或许正是Meta构建智能眼镜开发者生态的正式起点。

  • 共 148 条2/10<12345>

    VR52

    VR52网成立于2015年,平台提供VR头显、AR眼镜、配件外设、厂商、测评、行业资讯、游戏与应用、展会活动等。

    热门VR眼镜
    标签
    头显眼镜对比
    清除所有