Meta 近期公布一项新研究,成功将其高保真全身 Codec Avatars 技术进行“蒸馏”(distillation),使其可在 Quest 3 等独立式头显上实时运行,最多同时渲染 3 个全身数字形象。
这一成果通过名为 “SqueezeMe” 的技术实现,相关论文题为《SqueezeMe: Mobile-Ready Distillation of Gaussian Full-Body Avatars》。
Codec Avatars 是 Meta 研发近十年的一项技术,旨在创建照片级真实感的数字人形象,其面部和眼部动作由 VR 头显的眼动与面部追踪数据实时驱动。
该技术的目标是实现“社交临场感”(social presence)——即用户在潜意识中感受到对方“真实在场”,尽管对方并不在物理空间中。目前任何平面屏幕技术(如视频通话)都无法实现这一效果。
“蒸馏”(distillation)是一种 AI 优化技术,通常用于大模型压缩:
使用一个大型、计算成本高的模型生成输出
用这些输出去训练一个小型、高效的模型
小模型在保持低资源消耗的同时,尽可能复现大模型的效果
Meta 研究人员利用此方法,将原本需高性能 PC 显卡运行的全身 Codec Avatars 模型,压缩至可在 Quest 3 的移动芯片上运行,同时调用其 NPU 和 GPU 资源。
指标 | 数据 |
---|---|
渲染数量 | 最多 3 个全身 Codec Avatars |
帧率 | 72 FPS |
画质损失 | 相比 PC 版本“几乎无质量损失” |
尽管性能出色,但该移动版本存在以下限制:
限制项 | 说明 |
---|---|
生成方式 | 依赖传统大型捕捉阵列(100 多个摄像头和数百盏灯),不支持通过智能手机扫描生成 |
光照表现 | 采用固定平面光照(flat lighting) |
动态重光照 | 不支持。这是 Meta 最新 PC 版 Codec Avatars 的核心功能,对融入 VR 环境和混合现实至关重要 |
项目 | 本次研究(SqueezeMe) | 近期头像研究(基于自拍视频) |
---|---|---|
形象类型 | 全身 | 仅头部 |
生成方式 | 多相机阵列捕捉 | 智能手机自拍视频 + 服务器处理约 1 小时 |
核心技术 | Gaussian Splatting + 蒸馏 | Gaussian Splatting |
运行平台 | Quest 3(独立运行) | 高性能 PC |
注:Gaussian Splatting 是近年来推动高保真体素渲染的关键技术,其作用类似于大语言模型(LLMs)对聊天机器人的推动。
Quest 3 和 Quest 3S 不具备眼动与面部追踪功能
Quest Pro 曾支持该功能,但已于 2025 年初停产
目前无公开信息表明 Meta 将在短期内推出具备眼动/面部追踪的新头显
一种可能的过渡方案是:
Meta 先推出平面屏幕版 Codec Avatars
利用 AI 模拟面部表情
用户可在 WhatsApp 和 Messenger 视频通话中使用,替代当前的 Meta Avatar 形象,获得更真实的表现
Meta Connect 2025 将于 2025 年 9 月 17 日举行
Meta 可能在此活动中公布 Codec Avatars 的更多进展
2025 年,公众对 Meta 尽快推出 Codec Avatars 的呼声显著上升,原因是:
苹果已在 visionOS 26 中推出 Personas 功能
这被视为实现了 Meta 多年承诺的社交临场感体验
Instagram 和 WhatsApp 等应用已可在 Meta Horizon Store 免费下载,但 Codec Avatars 尚未作为正式功能上线。
VR52网成立于2015年,平台提供VR头显、AR眼镜、配件外设、厂商、测评、行业资讯、游戏与应用、展会活动等。