这项由宾夕法尼亚州立大学研究团队开发的FOVER方法解决了AI推理验证器训练中的两大难题:数据标注成本高和应用范围有限。研究者利用形式验证工具(如Z3和Isabelle)自动检查AI在形式逻辑和定理证明任务中的每一步推理是否正确,创建了高质量的训练数据集。令人惊喜的是,经过这种训练的验证器不仅无需人工标注数据,还能泛化到各类推理任务,在12个不同基准测试中表现优异,甚至在某些任务上超越了使用人工标注训练的验证器。这为提高AI推理能力提供了一条高效、通用的新途径。
至顶网 科技行者 2025-05-28 18:37:07