搜索准确率最高的计划软件【罔芷:——88pk·ee—

大规模推理能力如何提升大语言模型的事实准确性：从思考长短与可靠性角度的实证研究

这篇研究来自丹麦奥尔堡大学的团队，探讨了大语言模型的推理过程如何影响事实准确性。研究者通过从高级推理模型中提取思考轨迹，并用知识图谱增强这些轨迹，然后对不同规模的模型进行微调并在六个数据集上测试。结果表明，对小型模型而言，长推理过程显著提高事实准确性；而增加测试时计算资源（如并行采样或增加令牌预算）可使准确率提高2-8%。研究发现约2K令牌长度的推理效果最佳，为提升大语言模型事实准确性提供了新思路。

至顶网科技行者 2025-07-08 09:41:57

这个模型也能识别狗吗？希伯来大学让AI"考官"帮你从千万个模型里找到最合适的那一个

希伯来大学研究团队提出ProbeLog技术，通过"标准化考试"方式为AI模型建立能力指纹，解决了模型库中60%模型缺乏文档说明的搜索难题。该方法用固定图片测试模型反应，支持文字直接搜索，准确率达40-70%，并通过协作探测技术降低3倍计算成本，为百万级模型库的高效利用提供了新途径。

至顶网科技行者 2025-08-20 18:05:26

AI应用新场景：胎儿超声检查保母子安全

到2027年，全球胎儿监护市场预计将达到52亿美元。2022年，北卡罗来纳大学教堂山分校从比尔&梅琳达·盖茨基金会获得1700万美元赠款，用于继续推进AI在产科超声领域的应用。

至顶网至顶网软件与服务频道 2023-04-28 11:48:37

史丹佛AI突破：一秒钟预测十年后——机器学习中的超越人类能力边界探索

史丹佛大学AI实验室的突破性研究显示，机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域，AI预测准确率比人类专家高出15-25%，处理速度从几天缩短至几秒。这一发现不仅颠覆了对AI能力边界的认知，更为医疗、环保、商业等领域的决策革新开辟了广阔前景，标志着人机协作新时代的到来。

至顶网科技行者 2025-08-19 12:37:31

低秩矩阵揭示真相：利用主要权重提升大语言模型的推理能力

这项研究提出了一种名为LIFT的新型微调方法，通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明，仅更新5%的主要权重就能在推理任务上超越全参数微调，同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异，还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性，为资源高效的模型定制提供了新思路。

至顶网科技行者 2025-06-05 15:25:03

北卡罗来纳大学团队突破关系抽取难题：让小模型像人类专家一样推理

北卡罗来纳大学团队提出R1-RE框架，通过强化学习训练小模型模拟人类专家推理过程，在关系抽取任务中实现跨领域突破。该方法使7B参数模型达到GPT-4o级别性能，跨领域准确率提升30%，为AI推理训练提供新范式。

至顶网科技行者 2025-07-17 13:56:15

杨立昆喊了三年的理论，被一群心脏科 AI 研究者证实了

加拿大大学健康网络（UHN）团队于2026年2月发布EchoJEPA，首次将Meta科学家杨立昆提出的JEPA架构应用于医学影像领域。该模型在1800万条心脏超声视频上训练，通过在抽象空间预测而非逐像素重建的方式，从根本上解决了超声图像散斑噪声的干扰问题。

至顶网至顶AI实验室 2026-02-13 15:41:49

MetaStone-AI推出反思生成模型：32B参数就能媲美OpenAI o3-mini的推理能力

MetaStone-AI团队与中科大合作推出反思生成模型MetaStone-S1，仅用32B参数就实现了与OpenAI o3-mini相当的推理性能。该模型创新性地将推理生成和质量评估统一在一个架构中，通过自监督学习避免了昂贵的人工标注，在数学、编程和中文推理任务中表现出色，为AI推理能力发展提供了新思路。

至顶网科技行者 2025-07-21 11:36:32

华为将五合一扩展全闪存阵列加入产品组合

华为推出了一款新的全闪存OceanStor Pacific阵列9920，并透露了其压缩和面向勒索软件快速恢复的一些细节。

至顶网至顶网存储频道 2023-09-07 16:34:11

AI科技新应用：弥补与年龄相关的认知衰退

认知衰退是一种自然过程，会以不同程度影响到每一个人。认知衰退往往影响到处理速度、注意力与记忆力等下降。这些变化最早可能在我们30多岁时就开始出现，到60多岁及之后引发越来越明显的影响。2022年《自然-衰老》上发表的一项研究就对此做出了说明。

至顶网至顶网人工智能频道 2024-07-23 10:31:55

让AI像自来水一样简单，华为云通用AI解决方案体验

通用AI的应用前景非常广阔，它可以在医疗、交通、金融、教育、娱乐等各个领域发挥作用，为人类带来更好的生活体验和更高效的工作方式。

至顶网至顶网云计算频道 2023-06-28 11:10:32

"干扰效应"：理解RAG系统中的不相关段落如何影响AI决策

这篇研究揭示了检索增强生成(RAG)系统中的"干扰效应"问题：当检索到的段落虽与查询相关但不包含正确答案时，会误导语言模型生成错误回答。研究团队提出了量化段落干扰效应的方法，并发现这种效应在不同模型间具有高相关性。他们开发了多种获取干扰段落的方法，包括标准检索、答案偏斜检索和基于生成的方法。实验表明，利用这些干扰段落进行微调可显著提高模型抵抗干扰的能力，在多个测试集上准确率提升高达7.5%。

至顶网科技行者 2025-05-27 09:36:17

GraLoRA：解决大型语言模型微调瓶颈的突破性方法 — SqueezeBits和POSTECH联合研究

SqueezeBits和POSTECH联合研究团队提出了GraLoRA，一种改进的参数高效微调方法，解决了传统LoRA在高秩设置下的表现瓶颈。通过将权重矩阵分解成多个独立的子块，每块配备自己的低秩适配器，GraLoRA有效增加了表达能力并减少了梯度纠缠问题。实验证明，这种方法在代码生成任务中提升了高达8.5%的Pass@1准确率，并在常识推理任务中持续优于现有方法。GraLoRA无需额外计算成本，为大型语言模型的定制化提供了更高效的解决方案。

至顶网科技行者 2025-05-31 11:41:05

释放AI潜力：从数据中心到汽车，Nvidia意图巩固深度学习领先地位

Nvidia今天在美国加利福尼亚州圣何塞举行的GPU Technology Conference大会上推出了大量新产品和新服务，所有这些都围绕着Nvidia的GPU和相关软件。

至顶网 siliconANGLE 2018-03-29 10:10:01

解锁多模态推理力量：华中科技大学推出MMMR基准，全面评测模型思考能力

华中科技大学与利哈伊大学研究团队开发的MMMR基准是首个专门评估多模态大语言模型推理思考过程的综合工具。通过1,083个跨六大领域的高难度推理任务和创新的推理过程评估管道，研究发现即使最先进的模型在推理任务上也与人类存在约10%的差距。研究揭示了答案准确性与推理质量间的脱节：模型常出现思考不一致(41.5%)、过度思考(20.5%)等问题。这一基准不仅评估答案正确性，更深入分析思考质量，为提升AI系统的可靠性和透明度提供了重要方向。

至顶网科技行者 2025-05-31 10:06:36

亚马逊云科技助力联合利华中国加速数字化转型全面提升运营效率

亚马逊云科技助力世界领先的快消品公司联合利华中国，建立起以数据、技术和洞察为核心的智能化运营云平台，进行数字化转型和创新。

至顶网至顶网CIO与CTO频道 2021-09-06 17:50:47

华为云以人工智能技术加速智能驾驶量产车数据迭代

华为云提供“训练加速、数据加速、算力加速”三层加速方案，使能模型的高效训练和推理，实现自动驾驶数据的快速闭环流转。

至顶网业界供稿 2023-04-03 13:33:55

鉴释获得A＋轮融资，将加强对新技术的投资并扩展中国团队规模

专注于深度静态代码分析领域的鉴释今日宣布，已完成由将门创投及红点创投中国基金（红点中国）联合领投的A＋轮融资。

至顶网业界供稿 2020-07-29 12:19:25

HPE携手Tookitaki，为亚太地区金融机构提供反洗钱解决方案

HPE GreenLake云服务强大而丰富的功能可以满足不同行业和企业的多元需求。近期，它又承载着由AI和机器学习驱动的解决方案，进入了一个相当“刺激”的领域——助力银行开展反洗钱调查。

至顶网 HPE中国 2021-06-09 09:09:05