上海交通大学AI团队提出的SpatialScore是迄今最全面的多模态空间理解评测基准,包含28K样本,涵盖各类空间任务。研究首创VGBench专门评估视觉几何感知能力,并开发SpatialAgent多代理系统,集成9种专业工具增强空间理解。实验表明,即使最先进的大模型在空间理解方面仍存显著局限,特别是在视觉几何感知任务上,而SpatialAgent通过结构化工具调用显著提升性能。这项工作为未来多模态模型在实体AI应用中的发展提供关键方向,填补了AI系统在3D空间认知能力评估的重要空白。
至顶网 科技行者 2025-05-28 08:09:45