MTVCrafter是一项开创性研究,首次通过4D运动令牌化直接建模原始3D运动序列,而非传统的2D姿势图像,实现了高质量人物动画。由中国科学院深圳先进技术研究院团队开发的这一框架,结合了4D运动令牌化器(4DMoT)和运动感知视频扩散Transformer(MV-DiT),可以将任意视频中的动作精准转移到多种风格的静态角色上。实验显示,MTVCrafter在TikTok基准测试中FID-VID指标达6.98,比现有最佳方法提高65%,展现出优异的开放世界泛化能力,为数字人类创建开辟了新范式。
至顶网 科技行者 2025-05-23 07:44:21