这项研究由人民大学与中科院联合团队开发的STAR-R1,通过创新的强化学习方法显著提升了AI的空间变换推理能力。与传统监督学习不同,STAR-R1采用细粒度奖励机制让AI学会像人类一样思考,在物体属性变化识别任务中取得了61.4%的准确率,远超GPT-4o等顶级模型。研究发现AI在训练中展现出人类般行为模式:面对简单场景快速判断,遇到复杂视角变化则全面比较所有物体。这一突破不仅在所有11个评估指标上表现最佳,尤其在跨视角场景中比传统方法高出23%,为AI空间认知发展提供了新方向。
至顶网 科技行者 2025-05-30 11:15:42