用了 0.025601秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1377 条
  • NOVER:语言模型的无验证器强化学习激励训练

    NOVER是一种创新的无验证器强化学习框架,解决了传统激励训练依赖外部验证器的限制。由伦敦国王学院研究团队开发,它通过计算"推理困惑度"作为奖励代理,使语言模型能在任何文本任务中自主发展推理能力。实验表明,NOVER在一般推理、创意写作、社会智能和多语言能力等多种任务上均优于基线方法,甚至使3B模型接近从671B模型蒸馏版本的性能。此外,其灵活性还支持"反向激励训练"等创新应用,为语言模型训练开辟了新方向。
    至顶网  科技行者  2025-05-29 08:25:24  
  • ARM:自适应推理模型如何解决大型推理模型的"过度思考"问题

    自适应推理模型(ARM)解决了大型推理模型的"过度思考"问题,能够根据任务难度自动选择合适的推理格式。研究团队通过创新的Ada-GRPO算法训练,使ARM在保持性能的同时平均减少30%的计算量,并提供自适应、指令引导和共识引导三种工作模式。这一突破使AI更接近人类思维方式,在简单问题上直接作答,复杂问题上才详细推理,极大提升了计算效率。
    至顶网  科技行者  2025-05-30 07:45:05  
  • 巧用梯度分组:西湖大学团队打造更高效的大语言模型训练方式

    西湖大学团队提出的梯度分组缩放(SGG)方法巧妙解决了大语言模型训练中的关键挑战。与传统方法不同,SGG动态聚类每层参数并应用特定缩放因子,既保留参数级优化又引入组级约束。实验证明,SGG在多种任务和模型规模上显著提升性能,特别是使低秩训练首次达到全秩性能水平,且具有出色的稳定性和灵活性,为资源受限环境下的大模型训练提供了实用解决方案。
    至顶网  科技行者  2025-06-05 15:19:15  
  • 腾讯觅影获中国人工智能大赛“创新之星”奖 破解医疗AI普及难点

    2020中国人工智能高峰论坛暨中国人工智能大赛发布会在厦门举行,“腾讯觅影”医疗影像人工智能解决方案荣获大赛“创新之星”奖。
    至顶网  至顶网人工智能频道  2020-12-24 15:01:06  
  • 推理增强的大模型更容易产生幻觉吗?清华和新加坡国立大学团队深度解析

    这项研究由清华大学和新加坡国立大学团队完成,系统探讨了大推理模型在事实查询任务中的幻觉问题。研究发现,仅通过单一训练阶段(仅SFT或仅RL)开发的推理模型更容易产生幻觉,而完整SFT+RL流程训练的模型幻觉较少。研究者识别出两种导致幻觉的关键认知行为:"错误重复"和"思考-答案不匹配",并从模型不确定性校准角度揭示了幻觉产生的内在机制,为开发更可靠的推理模型提供了重要指导。
    至顶网  科技行者  2025-06-03 13:33:56  
  • 英特尔发布零售门店数字化赋能专项报告, 引领行业智能化升级

    英特尔亮相第二十四届中国零售业博览会(China Shop 2024)。会上,英特尔发布了《零售门店数字化赋能专项报告(2024年)》。
    至顶网  业界供稿  2024-03-14 09:10:53  
  • 人工智能的自学奇迹:清华大学研究团队开创"无师自通"的AI学习新方法

    想象一下这个场景:一位学生拿到了一套没有标准答案的数学题。正常情况下,没有答案怎么知道自己做得对不对呢?大多数学生会卡在这一步。但如果这位学生非常聪明,他会想出一个办法——先用不同的解题思路做几遍,然后看哪个答案出现的次数最多,那个答案很可能就是正确的。接着,他会思考为什么其他方法得到了不同的答案,从而改进自己的解题技巧。这就是清华大学研究团队开发的"测试时强化学习"(TTRL)的核心思想。
    至顶网  科技行者  2025-04-24 14:24:43  
  • 视觉语言模型能看懂色彩世界吗?马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试

    你是否曾经因为衣服色彩搭配不协调而尴尬?或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑?色彩在我们的日常生活中扮演着至关重要的角色,从科学发现到医疗保健,从购物到艺术欣赏,无处不在。而人工智能,特别是视觉语言模型(VLMs),正在迅速融入我们的生活,但它们真的能像人类一样理解和利用色彩信息吗?
    至顶网  科技行者  2025-04-18 16:53:57  
  • 华为云潘捷:九类关键能力、六大解决方案,华为云助力车企数字化转型

    2021年12月19日,在北京 · 北苑大酒店举办的“2021中关村数字经济产业联盟会员代表大会暨华为云北京城市峰会”的领跑汽车智能时代高峰论坛上,华为云中国区副总裁,云原生企业业务部部长潘捷发表演讲。
    至顶网  业界供稿  2021-12-20 17:25:01  
  • 启动前先热身:如何在资源受限环境下激发AI大模型的通用推理能力

    纽约大学阿布扎比分校研究团队提出了一种创新的两阶段训练方法,解决了AI领域的数据稀缺问题。他们首先让AI模型在简单的"骑士与恶棍"逻辑游戏中"热身",学习通用推理技能,然后再用少量特定领域数据进行强化学习。实验表明,这种方法不仅大幅提升了模型在数学、编程和多学科理解任务上的表现,还显著提高了样本效率,使用仅100个样本就能达到传统方法需要数千样本才能实现的效果。更重要的是,"热身"过的模型在适应特定领域后仍能保持跨领域的泛化能力,为资源受限环境下开发强大AI系统提供了实用策略。
    至顶网  科技行者  2025-05-26 17:01:41  
  • VisuLogic:一个评估多模态大语言模型视觉推理能力的基准测试

    想象一下,你正在参加一场智力测试。主考官给你看了一张图片,并要求你找出图案的规律,预测下一个图形会是什么样子。对我们人类来说,这种视觉推理任务虽然有难度,但通常还算可行——我们能够观察图案变化、识别规律,然后做出合理推测。
    至顶网  科技行者  2025-04-25 14:17:31  
  • Atlas:谷歌研究团队打造的"超级记忆师",让AI模型记住整个上下文而非单个词

    Google研究团队推出Atlas,一种革命性的AI记忆优化模型,解决传统Transformer架构在处理长文本时的计算复杂度问题。Atlas通过三大创新:超线性容量的记忆模块、基于上下文而非单词的记忆优化、及使用Muon优化器的高效记忆管理,实现了在超长文本(10M)处理中保持80%以上的准确率。研究还提出DeepTransformers架构,作为传统Transformer的严格泛化版本,在语言建模和常识推理任务中展现出色性能。
    至顶网  科技行者  2025-06-03 17:00:14  
  • GPU集群助力百度为行业提供高效定制化AI训练和推理平台

    在赋能行业的平台的背后,EasyDL依托于NVIDIA的Tesla GPU深度学习平台,搭建了用于深度学习模型训练(Training)和服务(Inference)阶段的GPU集群。
    至顶网  业界供稿  2018-07-06 08:04:46  
  • 商汤科技用AI赋能遥感影像智能解译 推动空间智能

    沈徽在以“智能视觉,看懂世界”为题的主题演讲中表示,如今人工智能技术已经快速渗透到各行各业,并且通过技术提升驱动生产力升级,不断为产业带来变革。
    至顶网  业界供稿  2018-06-15 13:53:14  
  • 英特尔亮相2024中国零售业博览会,发布多项行业最新进展

    英特尔亮相第二十四届中国零售业博览会(China Shop 2024)。会上,英特尔发布了《零售门店数字化赋能专项报告(2024年)》。
    至顶网  业界供稿  2024-03-14 14:19:27  
  • 华为云AI院长峰会在黔举行 推动人工智能产学研创新发展

    7月22日,第三届华为云AI院长峰会在贵安召开。多位中国工程院院士、中国科学院院士,以及来自国内近30所顶尖高校的60余名院长、教授、专家汇聚一堂,共同探讨人工智能发展的新趋势及新挑战,促进人工智能创新思想、技术、产业、应用、人才的集聚和落地。
    至顶网  至顶网CIO与CTO频道  2022-07-22 17:20:16  
  • 蚂蚁智能凭证安全产品“光鉴”通过国家级机构测评,产品性能获权威认证

    蚂蚁集团智能凭证安全产品全项通过信通院能力测评,获最高评级。
    至顶网  至顶网软件与服务频道  2024-04-29 17:09:19  
  • 双头优化:一种简单高效的半监督式视觉-语言模型知识蒸馏方法

    本研究提出了双头优化(DHO)框架,一种解决视觉-语言模型知识蒸馏中梯度冲突问题的创新方法。通过设计两个独立的预测头分别学习标记数据和教师信号,DHO有效缓解了传统单头方法中的梯度冲突,提升了特征学习质量。实验结果显示,DHO在ImageNet等11个数据集上一致超越基线方法,使用1%标记数据时较现有最佳方法提高了3%的准确率,同时参数量更少。此外,DHO支持推理时通过线性组合双头输出灵活调整模型表现,为半监督学习下的知识蒸馏提供了一种简单高效的解决方案。
    至顶网  科技行者  2025-05-21 14:23:13  
  • Pinecone 推出 AI 代理构建 API,简化 RAG 开发

    Pinecone 推出了 Pinecone Assistant,一种 AI 智能助手构建 API 服务,旨在加速检索增强生成(RAG)应用的开发。该服务集成了向量搜索、模型编排和重排等功能,简化了 RAG 应用的构建过程。Pinecone Assistant 提供了优化的接口、自定义指令和多种文件格式支持,为开发者提供了灵活且高效的 AI 智能助手构建工具。
    至顶网  BLOCKS & FILES  2025-01-24 17:14:58  
  • NVIDIA团队揭秘:如何让AI既会解数学题又能写代码——AceReason-Nemotron 1.1的训练秘籍

    NVIDIA研究团队揭示了训练AI模型同时掌握数学推理和编程能力的突破性方法。通过精心设计的监督学习和强化学习协同训练,他们发现仅用数学题训练就能显著提升编程能力。研究提出了温度调节、阶段性训练等关键技术,最终的AceReason-Nemotron 1.1模型在多项权威测试中达到业界领先水平,为AI跨领域能力发展提供了新范式。
    至顶网  科技行者  2025-06-23 09:26:13  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号