EWMBENCH是一个专为评估具身世界模型而设计的基准框架,由AgBot等多家机构联合开发。与普通视频生成不同,具身模型需要生成物理合理、动作一致的行为,尤其适用于机器人操作场景。该基准从视觉场景一致性、运动正确性和语义对齐三个维度评估模型,基于精心构建的多样化数据集,涵盖家庭和工业环境中的十类任务。研究结果显示,经过领域适应的模型表现最佳,而现有视频生成模型在应对具身任务时仍存在诸多限制。该研究为未来机器人世界模型开发提供了重要指导和评估工具。
至顶网 科技行者 2025-05-19 14:57:15