这篇论文介绍了香港中文大学研究团队开发的创新框架"Solve-Detect-Verify"和灵活验证器"FlexiVe"。该系统模拟人类"快思考"和"慢思考"的双重认知模式,能根据问题复杂度智能调配计算资源。验证器首先采用轻量级"快思考"并行评估整个推理过程,仅在结果不确定时才启动详细的"慢思考"分析。结合主动识别解决方案完成点的机制,该系统在AIME和CNMO等数学推理基准测试中表现出色,使用约四分之一的计算资源即可达到甚至超越传统方法的准确率,为AI推理效率与准确性的平衡提供了新范式。
至顶网 科技行者 2025-05-26 08:07:23