搜索准确率最高的计划软件【罔芷:——88pk·ee—

System-1.5 推理：蒙特利尔大学研究团队打造动态捷径，让AI思考更灵活高效

这项来自蒙特利尔大学研究团队的突破性工作提出了System-1.5推理框架，通过在潜在空间中创建动态捷径，使大语言模型能够灵活调整思考路径。研究者设计了模型深度捷径和推理步骤捷径，让AI系统能像人类一样区分关键与非关键推理步骤，在不损失准确性的情况下将推理速度提升20倍以上。这种方法在数学推理和常识推理任务上表现出色，为解决大语言模型推理效率问题提供了全新思路。

至顶网科技行者 2025-06-04 11:14:16

两位专家足矣：在无需额外训练的情况下提升MoE推理模型的认知努力

腾讯和浙江大学研究团队提出了"认知专家增强"（RICE）方法，无需额外训练即可提升MoE推理模型性能。通过归一化点态互信息识别关键认知专家后，仅增强两个专家的权重就能显著提高模型在数学和科学推理任务上的准确率，同时减少计算量。这种轻量级方法展现出良好的跨领域泛化能力，为高效AI推理开辟新路径。

至顶网科技行者 2025-05-26 17:58:18

专家精简大法：香港中文大学与华为诺亚方舟实验室联手助力大型混合专家模型在内存受限设备上高效运行

香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架，解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征，据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明，DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率，内存需求降至688GB；而更激进的精简方案（减少87.5%专家）也能保持72.0%的准确率。该方法适用于多种MoE架构，为强大AI系统的广泛部署铺平了道路。

至顶网科技行者 2025-06-01 11:29:37

机器也要"察言观色"：上海人工智能实验室推出视觉推理新挑战，揭开AI视觉理解的最后一块面纱

上海人工智能实验室等机构联合发布VisuLogic基准测试，专门评估AI的纯视觉推理能力。测试包含1000道人工验证题目，涵盖数量、空间、位置等六类推理任务。结果显示，包括GPT-4o在内的顶级AI模型准确率仅26-28%，远低于人类51.4%的表现，揭示了当前AI在视觉逻辑推理方面的严重不足。研究通过强化学习训练实现了显著提升。

至顶网科技行者 2025-07-16 09:59:03

来微软人工智能大会，体验你触手可及的AI

微软全球人工智能负责人沈向洋将亲携微软众多技术大咖亲临微软人工智能大会（Microsoft AI Innovate 2018），与您分享众多最前沿、最实用的AI技术以及最鲜活的成功案例。

至顶网邹大斌 2018-05-18 16:04:33

SATORI-R1：华中科技大学研究团队通过空间定位和可验证奖励增强多模态推理能力

华中科技大学和香港中文大学研究团队提出SATORI-R1，一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段，解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明，SATORI-R1在七个视觉问答基准上一致提升性能，最高达15.7%，并展示出更聚焦的视觉注意力和更低的训练方差。

至顶网科技行者 2025-06-01 16:09:53

华为云盘古大模型通过中国信通院大规模预训练模型首轮评测

8月16日-17日，2022年可信AI峰会在北京举办。华为云盘古预训练大模型通过中国信息通信研究院（以下简称“中国信通院”）首轮大模型测评，在“模型开发”和“模型能力”两部分达到4+级标准。

至顶网业界供稿 2022-08-16 18:28:07

模型越大，长期执行力越强，剑桥团队指出传统基准测试过时

至顶网至顶AI实验室 2025-09-17 17:57:52

MIT等名校联手攻克AI推理难题：训练时"长篇大论"，推理时"言简意赅"的秘诀

MIT等顶尖高校联合发布AI推理效率突破性研究，提出"训练时长思考、推理时短表达"的课程学习策略。通过从宽松到严格的渐进式训练，让AI在保持高准确率的同时实现三倍效率提升，为解决AI推理成本高昂问题提供了创新方案。

至顶网科技行者 2025-08-15 08:49:08

PATS技术：博尔扎诺自由大学研究团队开创的运动技能评估新方法，让AI更懂专业运动员的动作质量

博尔扎诺自由大学研究团队开发的PATS技术通过保留完整运动片段代替随机抽取视频帧，显著提升了AI评估体育技能的能力。该方法在EgoExo4D基准测试中表现出色，攀岩评估准确率提高26.22%，音乐提高2.39%，篮球提高1.13%。PATS能根据不同运动类型自动调整采样策略，为体育训练和人才发展提供了更准确的自动评估技术。

至顶网科技行者 2025-06-09 16:56:21

勇攀技术高峰华为云围绕AI根技术发布四项全新云服务

11月7日，华为全联接大会（HUAWEI CONNECT）2022中国站在深圳拉开帷幕。为解决企业在AI落地时面临的挑战，促进释放AI生产力，华为云在“一切皆服务”的基础上不断夯实基础能力，围绕大模型与求解器技术发布四项全新AI服务。

至顶网至顶网CIO与CTO频道 2022-11-07 17:43:56

AI视觉推理模型的"顿悟时刻"真的存在吗？伊利诺伊大学研究揭示令人意外的真相

伊利诺伊大学研究团队通过对比实验发现，经过强化学习训练的视觉语言模型虽然表现出"顿悟时刻"现象，但这些自我纠错行为并不能实际提升推理准确率。研究揭示了AI模型存在"生成-验证差距"，即生成答案的能力强于验证答案质量的能力，且模型在自我验证时无法有效利用视觉信息，为AI多模态推理发展提供了重要启示。

至顶网科技行者 2025-07-02 14:26:09

通义APP全面升级翻译能力，打造最强翻译综合体

升级后的翻译能力不仅支持119种语言和方言。

至顶网至顶网人工智能频道 2025-06-19 17:06:01

EquivPruner：通过行动剪枝提升大型语言模型搜索的效率与质量

这篇研究论文介绍了EquivPruner，一种通过识别和剪除语义等价行动来提高大型语言模型(LLM)推理搜索效率与质量的创新方法。中国科学技术大学与科大讯飞研究院合作开发的这一技术，在GSM8K数学测试上将Qwen2.5-Math-7B-Instruct模型的token消耗减少了48.1%，同时还略微提高了准确率。研究团队还创建了首个数学语句等价性数据集MathEquiv，为等价性检测研究奠定基础。实验表明，该方法在多种模型和数据集上均显示出显著效益，为LLM推理效率优化提供了新方向。

至顶网科技行者 2025-05-30 09:43:49

物联网时代下云知声的芯片战略很有“心”

如今，以物联网、人工智能、大数据、云计算等技术为核心的科技春风已经吹遍全球的各个角落，使得教育、医疗、家居、汽车等行业变得异常的生动活泼，也让不少传统行业逐渐变得"洋气"起来。

至顶网刘新萍 2018-05-23 11:53:05

量子硬件可能是 AI 的最佳搭档

人工智能能耗问题引发关注,量子计算或成解决方案。量子硬件在某些方面更适合AI底层数学运算,但目前错误率仍偏高。研究人员正着手准备,以便在硬件就绪时运行AI模型。本文探讨了量子AI的潜力,包括量子电路在机器学习中的应用、将经典图像数据输入量子处理器的方法,以及在真实量子硬件上运行AI算法的初步尝试。

至顶网 Arstechnica 2025-04-13 20:07:34

国内唯一，华为再次入选2022 Gartner SIEM魔力象限

本年度Gartner SIEM魔力象限入选厂商从2021年的20个减少到16个，华为是国内唯一入选Gartner SIEM魔力象限的厂商，也是国内唯一连续两年入围Gartner SIEM魔力象限的厂商。

至顶网至顶网大数据频道 2022-11-17 11:23:26

爬山过程铭刻的智慧远超登顶：腾讯和人民大学研究团队揭示AI推理中的"噪声奖励"惊人价值

这项研究揭示了大语言模型在学习推理时对噪声奖励的惊人适应力。研究表明，即使有40%的奖励信号被故意颠倒，Qwen-2.5-7B模型仍能将数学题准确率从5%提升至72%。更惊人的是，仅奖励模型使用关键推理词组（如"首先，我需要..."），而不验证答案正确性，也能达到70%以上的准确率。研究者提出的推理模式奖励（RPR）不仅能让模型在数学任务中表现出色，还能有效校准开放性任务中的噪声奖励模型，提升较小模型的推理能力。这表明大模型在预训练阶段已掌握了推理能力，强化学习主要帮助它探索有效的推理模式。

至顶网科技行者 2025-06-03 17:40:47

一招制胜：通过单一问题的批评式微调释放大语言模型的推理潜力

这项研究提出了一种名为"批评式微调"的创新方法，证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验，发现这种方法在数学和逻辑推理任务上都取得了显著提升，平均提高15-16个百分点，而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。

至顶网科技行者 2025-06-07 22:25:15

从机器人感知到智能理解：UC伯克利推出Robo2VLM，利用真实机器人操作数据训练视觉语言模型

UC伯克利研究团队开发了Robo2VLM，一个创新框架，利用真实机器人操作数据增强视觉语言模型的空间推理能力。该研究从176K真实机器人轨迹创建了一个包含684,710个问题的大规模VQA数据集，涵盖463个场景和3,396个操作任务。实验表明，这些数据可显著提升模型在空间关系理解、目标推理和物理交互方面的能力，为机器人与AI系统的融合开辟新方向。

至顶网科技行者 2025-05-28 07:40:43