这篇研究论文介绍了EquivPruner,一种通过识别和剪除语义等价行动来提高大型语言模型(LLM)推理搜索效率与质量的创新方法。中国科学技术大学与科大讯飞研究院合作开发的这一技术,在GSM8K数学测试上将Qwen2.5-Math-7B-Instruct模型的token消耗减少了48.1%,同时还略微提高了准确率。研究团队还创建了首个数学语句等价性数据集MathEquiv,为等价性检测研究奠定基础。实验表明,该方法在多种模型和数据集上均显示出显著效益,为LLM推理效率优化提供了新方向。
至顶网 科技行者 2025-05-30 09:43:49