这项研究介绍了EOC-Bench,一个创新基准测试,专门评估多模态大语言模型在第一人称视角场景中对物体的认知能力。研究团队从三个时间维度(过去、现在和未来)构建了3,277个问答对,涵盖11个细粒度评估维度,创新性地使用视觉提示解决物体引用问题。评估结果显示,即使最先进的模型如GPT-4o在物体时间感知方面也显著落后于人类,特别是在绝对时间感知上。这一研究为发展更强大的体感AI系统提供了重要参考,对增强现实和机器人技术等领域具有深远影响。
至顶网 科技行者 2025-06-09 14:35:11