用了 0.038354秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1261 条
  • 掀开面纱:爱丁堡大学研究团队揭示多跳问题答案中语言模型如何处理上下文排列

    这项由爱丁堡大学和华为研究团队完成的研究探究了大语言模型在多跳问题答案任务中如何处理上下文排列。研究发现:编码器-解码器模型(如Flan-T5)在未微调时表现优于更大规模的因果解码器模型;改变黄金文档顺序揭示了前向排列(符合推理链)带来最佳性能;为因果解码器模型添加双向注意力机制显著提升性能并增强对文档排序变化的鲁棒性;文档间距离越大性能越差;模型在回答正确时往往对关键文档分配更高注意力权重。这些发现为优化检索增强生成系统提供了重要指导。
    至顶网  科技行者  2025-05-26 17:56:32  
  • 聚焦工业互联网,九州云构建工业智能制造边缘应用场景

    刀具行业作为传统工业的代表之一,在刀具使用量不断增加的情况下,传统刀具管理手段已不能满足日益复杂的刀具管理需求,加工企业中刀具管理成本也不断提升,传统刀具行业急需实现数字化转型,最终实现智能制造。
    至顶网  业界供稿  2018-08-10 10:31:30  
  • 阿里云数据库全面Serverless化,与AI共同驱动走向一站式智能数据平台

    大模型技术的突破,让AI更好地驱动底层技术迭代升级。
    至顶网  至顶网软件与服务频道  2023-11-01 15:51:30  
  • 交织式思考与应答:让大语言模型通过强化学习实现更快响应和更准确推理

    这项研究提出了"交织式推理"方法,通过强化学习训练大语言模型在复杂推理过程中穿插输出中间答案。与传统的"先思考后回答"模式不同,这种方式让模型像人类一样边思考边给出阶段性结论,不仅将首词响应时间平均减少80%以上,还在某些任务上将准确率提升高达19.3%。研究表明,模型本身就具备交织推理的潜力,通过适当的奖励机制可以显著增强这一能力,并泛化到未见过的复杂推理任务中。
    至顶网  科技行者  2025-05-29 13:20:36  
  • 西门子推进5纳米及以下集成电路测试与分析

    西门子数字工业软件近日推出了Tessent(TM) Hi-Res Chain 软件,旨在解决集成电路(IC)设计和制造团队在先进技术节点上面临的关键挑战。
    至顶网  至顶网软件与服务频道  2024-07-19 10:37:37  
  • 开发者,找找找丨GDC化身爱情孵化器Love Combinator,助你“码”上脱单

    GDC化身爱情孵化器
    至顶网  业界供稿  2025-02-17 22:38:30  
  • 百度推出首个全感官交互输入法,将AI能力全方位落地

    1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。
    至顶网  业界供稿  2019-01-16 18:30:20  
  • 从视频中学习3D世界:香港中文大学研究团队用3D视觉几何先验增强多模态大语言模型

    这项研究由香港中文大学团队提出了视频-3D几何大语言模型(VG LLM),一种无需依赖显式3D数据输入,仅通过普通视频就能理解3D世界的创新方法。通过集成3D视觉几何编码器,该模型能从视频序列中提取3D先验信息,显著提升空间推理能力。实验表明,该4B参数模型在多项3D场景理解和空间推理任务上超越了现有技术,甚至在VSI-Bench评估中胜过Gemini-1.5-Pro。
    至顶网  科技行者  2025-06-05 10:28:12  
  • 亚信科技欧阳晔:用行业大模型破解企业AI落地难题

    通用大模型对企业业务理解能力不足,会产生很大的幻觉或偏差,给出的答案并不能很好地支撑业务;此外,企业的数据通常会包含很多敏感信息,直接使用大模型会带来数据泄露和隐私风险;运行和维护 LLM 需要专业知识和技术能力,给企业的IT基础架构以及人员素质提出了更大的挑战。
    至顶网  赵晓勤  2024-05-22 09:47:03  
  • 大脑的双模思考:如何让AI像人类一样灵活切换快慢思维模式

    这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
    至顶网  科技行者  2025-06-07 08:30:07  
  • AI+能源 第四范式与华油能源打造油气智慧平台

    能源领域的AI变革才刚刚开始,第四范式与华油能源在能源服务行业进行开创性的探索,让能源行业搭上了最强劲的AI引擎 ,加快油田勘探开发生产一体化智慧平台的建设和实践落地进程。
    至顶网  李祥敬  2019-06-11 11:05:17  
  • 奇安信天眼独家中标中国移动态势感知一期工程全流量监测项目

    日前,中国移动发布“网络安全态势感知平台一期工程全流量安全监测设备中标结果公示”。结果显示,奇安信天眼全流量安全监测产品凭借优秀的能力脱颖而出,独家中标该项目,首次进军全球头部通信运营商中国移动集团总部。
    至顶网  至顶网网络与安全频道  2021-04-30 09:28:19  
  • 加速扩散大语言模型:UCLA研究团队提出自适应并行解码新方法

    UCLA计算机科学系研究团队提出的"自适应并行解码"(APD)方法,成功解决了扩散大语言模型面临的速度与质量权衡难题。该方法通过动态调整并行生成的词数,结合一个小型辅助自回归模型来评估生成质量,并引入KV缓存和掩码输入限制等优化措施,使扩散模型能在保持高质量输出的同时显著提升生成速度。实验表明,使用APD的Dream 7B模型不仅能达到每秒59个词的吞吐量(比基线提升近6倍),还在数学推理等任务上保持了接近原始水平的准确率,甚至超越了传统自回归模型的速度。
    至顶网  科技行者  2025-06-06 17:25:16  
  • 吕建成:人工智能大模型时代的机遇与理论挑战

    近日,在2022昇腾AI开发者创享日·成都站上,四川大学计算机学院院长吕建成进行了主题为《人工智能大模型时代的机遇与理论挑战》的精彩演讲。
    至顶网  业界供稿  2022-06-27 10:18:55  
  • 全国政协委员吴晶:”城市大脑”、”最多跑一次”应在全国推广

    全国政协委员、浙江省省政协副主席吴晶在两会提案中呼吁加强社会治理智能化水平。
    至顶网  阿里巴巴  2018-03-06 12:24:29  
  • NOVER:语言模型的无验证器强化学习激励训练

    NOVER是一种创新的无验证器强化学习框架,解决了传统激励训练依赖外部验证器的限制。由伦敦国王学院研究团队开发,它通过计算"推理困惑度"作为奖励代理,使语言模型能在任何文本任务中自主发展推理能力。实验表明,NOVER在一般推理、创意写作、社会智能和多语言能力等多种任务上均优于基线方法,甚至使3B模型接近从671B模型蒸馏版本的性能。此外,其灵活性还支持"反向激励训练"等创新应用,为语言模型训练开辟了新方向。
    至顶网  科技行者  2025-05-29 08:25:24  
  • ARM:自适应推理模型如何解决大型推理模型的"过度思考"问题

    自适应推理模型(ARM)解决了大型推理模型的"过度思考"问题,能够根据任务难度自动选择合适的推理格式。研究团队通过创新的Ada-GRPO算法训练,使ARM在保持性能的同时平均减少30%的计算量,并提供自适应、指令引导和共识引导三种工作模式。这一突破使AI更接近人类思维方式,在简单问题上直接作答,复杂问题上才详细推理,极大提升了计算效率。
    至顶网  科技行者  2025-05-30 07:45:05  
  • 巧用梯度分组:西湖大学团队打造更高效的大语言模型训练方式

    西湖大学团队提出的梯度分组缩放(SGG)方法巧妙解决了大语言模型训练中的关键挑战。与传统方法不同,SGG动态聚类每层参数并应用特定缩放因子,既保留参数级优化又引入组级约束。实验证明,SGG在多种任务和模型规模上显著提升性能,特别是使低秩训练首次达到全秩性能水平,且具有出色的稳定性和灵活性,为资源受限环境下的大模型训练提供了实用解决方案。
    至顶网  科技行者  2025-06-05 15:19:15  
  • 腾讯觅影获中国人工智能大赛“创新之星”奖 破解医疗AI普及难点

    2020中国人工智能高峰论坛暨中国人工智能大赛发布会在厦门举行,“腾讯觅影”医疗影像人工智能解决方案荣获大赛“创新之星”奖。
    至顶网  至顶网人工智能频道  2020-12-24 15:01:06  
  • 推理增强的大模型更容易产生幻觉吗?清华和新加坡国立大学团队深度解析

    这项研究由清华大学和新加坡国立大学团队完成,系统探讨了大推理模型在事实查询任务中的幻觉问题。研究发现,仅通过单一训练阶段(仅SFT或仅RL)开发的推理模型更容易产生幻觉,而完整SFT+RL流程训练的模型幻觉较少。研究者识别出两种导致幻觉的关键认知行为:"错误重复"和"思考-答案不匹配",并从模型不确定性校准角度揭示了幻觉产生的内在机制,为开发更可靠的推理模型提供了重要指导。
    至顶网  科技行者  2025-06-03 13:33:56  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号