新加坡国立大学研究团队开发的SynthRL是一种创新的数据合成管道,旨在提升视觉语言模型的推理能力。该方法通过三阶段流程自动生成更具挑战性的训练数据:首先基于难度选择模型已掌握的简单问题,然后生成保留原始答案的更复杂变体,最后验证问题的正确性与难度增加。应用于MMK12数据集后,研究生成了3300多个高质量问题,并在五个视觉数学推理基准上实现显著性能提升,尤其在最困难的样本上效果最为明显。这一研究证明了智能数据合成在增强AI推理能力方面的重要价值,为视觉语言模型的进一步发展开辟了新途径。
至顶网 科技行者 2025-06-06 17:28:14