用了 0.034827秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • Amazon-首创PROF算法让AI推理更聪明:不仅要答案对,过程也要清晰

    Amazon联合伊利诺伊大学开发PROF算法,解决AI数学推理中"答案对但过程错"的问题。该方法通过同时评估结果正确性和推理过程质量,筛选高质量训练样本,让AI既能答对题目又掌握清晰思维方法。实验显示准确率平均提升4%以上,推理过程质量显著改善,为构建可解释AI系统提供新思路。
    至顶网  科技行者  2025-09-22 10:48:50  
  • rStar-Coder:微软亚洲研究院打造大规模验证数据集,小模型也能实现卓越代码推理能力

    微软亚洲研究院研究团队开发的rStar-Coder通过构建大规模验证数据集,显著提升了语言模型的代码推理能力。该数据集包含418K个竞赛级代码问题和580K个长推理解决方案,每个都经过多样化测试案例验证。关键创新在于三步测试输入生成方法和相互验证机制,确保了数据的高质量和可靠性。实验表明,即使是小型模型也能达到卓越性能——Qwen2.5-7B从17.4%提升至57.3%,甚至在USACO奥林匹克竞赛中超越了规模更大的模型,证明了高质量训练数据比模型规模更重要。
    至顶网  科技行者  2025-05-31 11:40:42  
  • VerifyBench:为大语言模型的基于参考的奖励系统搭建基准测试

    VerifyBench是首个专门评估大语言模型基于参考的奖励系统的基准测试,填补了现有奖励评估基准的关键空白。由浙江大学、美团等机构联合开发,包含VerifyBench和更具挑战性的VerifyBench-Hard两个数据集。研究发现虽然大型模型在标准案例上表现出色,但在复杂案例上仍有显著改进空间。该基准测试通过精心构建的数据集和评估框架,为提升大模型推理能力提供了标准化评估工具,对强化学习训练具有重要意义。
    至顶网  科技行者  2025-05-27 17:11:24  
  • 不孕不育的新曙光:AI

    科学家们正在使用计算机算法进行胚胎分析,帮助育龄父母们建立自己的幸福家族。
    至顶网  科技行者  2021-01-12 14:36:28  
  • TUM团队突破性发现:AI模型竟能用"错误"数据学会完美推理!

    慕尼黑工业大学研究团队首次将"grokking"现象成功应用于真实世界的复杂推理任务,通过巧妙的数据增强策略,让仅有1.24亿参数的小型AI模型在多步推理任务上达到95-100%准确率,超越了GPT-4o等大型模型。更令人惊讶的是,即使训练数据中包含错误信息,也能增强而非削弱模型的推理能力。
    至顶网  科技行者  2025-07-11 09:47:23  
  • AI模型的新挑战:当问题不止一个,连最强大脑也会犯糊涂——清华大学与上海人工智能实验室的压力测试研究

    清华大学与上海人工智能实验室联合开展的这项研究发现,即使是最先进的AI模型如DeepSeek-R1,在同时处理多个问题时性能也会显著下降。研究团队开发了REST压力测试框架,通过对34个大型推理模型的测试,揭示了AI在多任务处理中的"问题遗漏"、"思维过度"等典型错误模式,为AI评测和开发提供了新的视角和方法。
    至顶网  科技行者  2025-07-22 09:27:04  
  • 佐治亚理工学院团队揭秘AI"读心术":让机器看透图片背后的故事

    佐治亚理工学院研究团队开发的ConceptAttention技术首次实现了对AI图像生成模型内在机制的精确解读,能够生成高质量概念定位地图,准确显示AI如何理解图片中各种概念的位置。该技术在零样本图像分割任务中表现卓越,准确率达83.07%,超越15种先进方法,并成功扩展至视频分析领域,为AI可解释性研究开辟新方向。
    至顶网  科技行者  2025-08-20 18:06:34  
  • 实现具身智能 NVIDIA在COMPUTEX 2023上展示工业数字化最佳实践

    在生成式AI、3D协作、仿真模拟和自主机器技术的驱动下,制造业原有的工作流程正在改变,而NVIDIA提供全栈架构帮助制造业企业拥抱新革新,推动数字化转型。
    至顶网  李祥敬  2023-05-30 10:12:09  
  • 牧联链系统——北京牧国科技有限公司、北京理工大学

    基于隐私计算技术,系统整合肉牛数据,在保证数据隐私安全的基础上将数据开放给相应金融机构,为其更好地进行产品设计和决策进行赋能。
    至顶网  至顶网CIO与CTO频道  2024-03-27 12:12:59  
  • 大语言模型的几何平均策略优化:微软研究院让AI推理更稳定更聪明

    微软研究院等机构提出GMPO方法,通过几何平均替代算术平均处理强化学习中的词元级奖励,解决GRPO训练不稳定问题。该方法在数学推理任务上平均提升4.1%准确率,在多模态推理中提升1.4%,同时保持更稳定的重要性采样比率和更高的探索能力,为大语言模型训练提供了更可靠的优化策略。
    至顶网  科技行者  2025-08-05 10:32:39  
  • NVIDIA与英国国家医疗服务体系(NHS)信托基金携手为英国医院部署AI平台

    英国国家医疗服务体系(NHS)信托基金将使用NVIDIA和AI Centre联合开发的开源框架MONAI,提供面向脑卒中、失智症、心力衰竭、癌症等疾病的临床AI应用。
    至顶网  业界供稿  2022-11-29 09:40:56  
  • 图神经网络预测闪燃以拯救消防员生命

    当房间里的可燃材料突然开始全部燃烧,闪燃就会发生,闪燃导致巨大的热量和可燃气体激增,因而墙壁及爆裂窗户可能会突然破裂。在2008年至2018年的10年期间,美国约有800名消防员在工作中死亡,超过32万名消防员受伤,据估计,其中13%的事故是闪燃事件造成的。
    至顶网  至顶网软件与服务频道  2022-08-15 15:34:46  
  • 新南威尔士大学首创ZARA:让AI像侦探一样从运动传感器数据中识别人类活动

    新南威尔士大学研究团队开发了ZARA系统,这是首个零样本运动识别框架,能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理,不仅实现了比现有最强基线高2.53倍的识别准确率,还提供清晰的自然语言解释,为可穿戴设备和健康监护等应用领域带来了突破性进展。
    至顶网  科技行者  2025-08-27 15:22:41  
  • 京东金融对话语音识别大赛启动 选手可获OFFER、50万元GPU使用权

    8月16日,由京东集团与京东金融联合打造的国内首个距离产业界最近的数字探索者社区 “JDD空间站”(https://jdder.jd.com/)上线
    至顶网  业界供稿  2018-08-17 09:58:56  
  • 定制翻译:引导大语言模型"穿上"人类译者的文体风格

    这项研究探讨了如何使大语言模型生成的机器翻译体现特定译者的风格特点。研究团队来自格罗宁根大学和米兰-比可卡大学,他们使用PAR3数据集(包含7种语言小说的多译者翻译)进行实验。他们首先验证了译者风格的可区分性,然后比较了提示方法与转向技术在引导模型生成个性化翻译方面的效果。研究创新性地提出了基于稀疏自编码器的对比转向方法,通过调整模型内部表示来引导输出风格。结果表明,该方法在保持翻译质量的同时能有效实现个性化,且对较小模型尤其有效。
    至顶网  科技行者  2025-05-28 18:27:41  
  • 从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

    卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,为AI公司提供了新的知识产权保护手段。
    至顶网  科技行者  2025-07-16 09:13:03  
  • 世界杯直播背后腾讯云极速高清技术支撑

    目前,世界杯正在如火如荼的举行,作为足球运动最顶级的赛事,世界杯一度成为包揽近短时间的最大IP。同时,今年新成立的中央广播电视总台首次分销世界杯新媒体版权,也将今年国内球迷观赛人数拉上了一个新门槛。
    至顶网  业界供稿  2018-07-09 12:52:36  
  • 让艺术识别AI更聪明:意大利科学家用新数学方法突破传统限制

    意大利国家研究委员会团队提出了一种创新的艺术风格分类方法,将柯尔莫哥洛夫-阿诺德网络融入双教师知识蒸馏框架。该方法用自适应样条函数替代传统固定激活函数,能更精确捕捉艺术风格中的复杂非线性特征。在WikiArt和Pandora18k数据集上的实验表明,相比传统MLP投影头,该方法在多种主干架构上都实现了显著的性能提升,特别在细粒度艺术风格区分方面表现出色,为艺术风格自动识别和文化遗产数字化提供了新的技术路径。
    至顶网  科技行者  2025-08-06 11:13:50  
  • 伙伴+华为:以行业创新解决方案,释放万亿数智价值

    2025年是全要素可靠联接之年,是企业全业务上云的大发展之年,是行业大模型平权、普惠化之年,也是AI重构企业全业务启动之年。
    至顶网  金旺  2025-04-09 14:30:41  
  • 斯坦福和伯克利联手出招:AI能看出你动作哪里不标准了!

    斯坦福和伯克利研究团队推出VidDiff技术,让AI学会像专业教练一样精准识别动作差异。该技术通过三步走方法解决视频动作比较难题,构建了包含549对视频的大型数据集VidDiffBench。虽然当前AI模型准确率有限,但已展现在健身指导、医学培训、体育分析等领域的应用潜力。研究为AI理解细微动作差异开辟新方向,有望让人人享有智能化的动作指导。
    至顶网  科技行者  2025-07-30 09:51:47  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号