用了 0.033210秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • 史丹佛AI突破:一秒钟预测十年后——机器学习中的超越人类能力边界探索

    史丹佛大学AI实验室的突破性研究显示,机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域,AI预测准确率比人类专家高出15-25%,处理速度从几天缩短至几秒。这一发现不仅颠覆了对AI能力边界的认知,更为医疗、环保、商业等领域的决策革新开辟了广阔前景,标志着人机协作新时代的到来。
    至顶网  科技行者  2025-08-19 12:37:31  
  • 低秩矩阵揭示真相:利用主要权重提升大语言模型的推理能力

    这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。
    至顶网  科技行者  2025-06-05 15:25:03  
  • 北卡罗来纳大学团队突破关系抽取难题:让小模型像人类专家一样推理

    北卡罗来纳大学团队提出R1-RE框架,通过强化学习训练小模型模拟人类专家推理过程,在关系抽取任务中实现跨领域突破。该方法使7B参数模型达到GPT-4o级别性能,跨领域准确率提升30%,为AI推理训练提供新范式。
    至顶网  科技行者  2025-07-17 13:56:15  
  • MetaStone-AI推出反思生成模型:32B参数就能媲美OpenAI o3-mini的推理能力

    MetaStone-AI团队与中科大合作推出反思生成模型MetaStone-S1,仅用32B参数就实现了与OpenAI o3-mini相当的推理性能。该模型创新性地将推理生成和质量评估统一在一个架构中,通过自监督学习避免了昂贵的人工标注,在数学、编程和中文推理任务中表现出色,为AI推理能力发展提供了新思路。
    至顶网  科技行者  2025-07-21 11:36:32  
  • 华为将五合一扩展全闪存阵列加入产品组合

    华为推出了一款新的全闪存OceanStor Pacific阵列9920,并透露了其压缩和面向勒索软件快速恢复的一些细节。
    至顶网  至顶网存储频道  2023-09-07 16:34:11  
  • 最新MLCommons结果公布 英特尔展现强大AI推理性能

    今日,MLCommons公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1性能基准测试结果,其中包括英特尔所提交的基于Habana Gaudi2 加速器、第四代英特尔至强可扩展处理器,以及英特尔至强CPU Max系列的测试结果。
    至顶网  业界供稿  2023-09-13 09:44:40  
  • AI科技新应用:弥补与年龄相关的认知衰退

    认知衰退是一种自然过程,会以不同程度影响到每一个人。认知衰退往往影响到处理速度、注意力与记忆力等下降。这些变化最早可能在我们30多岁时就开始出现,到60多岁及之后引发越来越明显的影响。2022年《自然-衰老》上发表的一项研究就对此做出了说明。
    至顶网  至顶网人工智能频道  2024-07-23 10:31:55  
  • 让AI像自来水一样简单,华为云通用AI解决方案体验

    通用AI的应用前景非常广阔,它可以在医疗、交通、金融、教育、娱乐等各个领域发挥作用,为人类带来更好的生活体验和更高效的工作方式。
    至顶网  至顶网云计算频道  2023-06-28 11:10:32  
  • "干扰效应":理解RAG系统中的不相关段落如何影响AI决策

    这篇研究揭示了检索增强生成(RAG)系统中的"干扰效应"问题:当检索到的段落虽与查询相关但不包含正确答案时,会误导语言模型生成错误回答。研究团队提出了量化段落干扰效应的方法,并发现这种效应在不同模型间具有高相关性。他们开发了多种获取干扰段落的方法,包括标准检索、答案偏斜检索和基于生成的方法。实验表明,利用这些干扰段落进行微调可显著提高模型抵抗干扰的能力,在多个测试集上准确率提升高达7.5%。
    至顶网  科技行者  2025-05-27 09:36:17  
  • GraLoRA:解决大型语言模型微调瓶颈的突破性方法 — SqueezeBits和POSTECH联合研究

    SqueezeBits和POSTECH联合研究团队提出了GraLoRA,一种改进的参数高效微调方法,解决了传统LoRA在高秩设置下的表现瓶颈。通过将权重矩阵分解成多个独立的子块,每块配备自己的低秩适配器,GraLoRA有效增加了表达能力并减少了梯度纠缠问题。实验证明,这种方法在代码生成任务中提升了高达8.5%的Pass@1准确率,并在常识推理任务中持续优于现有方法。GraLoRA无需额外计算成本,为大型语言模型的定制化提供了更高效的解决方案。
    至顶网  科技行者  2025-05-31 11:41:05  
  • 释放AI潜力:从数据中心到汽车,Nvidia意图巩固深度学习领先地位

    Nvidia今天在美国加利福尼亚州圣何塞举行的GPU Technology Conference大会上推出了大量新产品和新服务,所有这些都围绕着Nvidia的GPU和相关软件
    至顶网  siliconANGLE  2018-03-29 10:10:01  
  • 解锁多模态推理力量:华中科技大学推出MMMR基准,全面评测模型思考能力

    华中科技大学与利哈伊大学研究团队开发的MMMR基准是首个专门评估多模态大语言模型推理思考过程的综合工具。通过1,083个跨六大领域的高难度推理任务和创新的推理过程评估管道,研究发现即使最先进的模型在推理任务上也与人类存在约10%的差距。研究揭示了答案准确性与推理质量间的脱节:模型常出现思考不一致(41.5%)、过度思考(20.5%)等问题。这一基准不仅评估答案正确性,更深入分析思考质量,为提升AI系统的可靠性和透明度提供了重要方向。
    至顶网  科技行者  2025-05-31 10:06:36  
  • 亚马逊云科技助力联合利华中国加速数字化转型 全面提升运营效率

    亚马逊云科技助力世界领先的快消品公司联合利华中国,建立起以数据、技术和洞察为核心的智能化运营云平台,进行数字化转型和创新。
    至顶网  至顶网CIO与CTO频道  2021-09-06 17:50:47  
  • 华为云以人工智能技术加速智能驾驶量产车数据迭代

    华为云提供“训练加速、数据加速、算力加速”三层加速方案,使能模型的高效训练和推理,实现自动驾驶数据的快速闭环流转。
    至顶网  业界供稿  2023-04-03 13:33:55  
  • 鉴释获得A+轮融资,将加强对新技术的投资并扩展中国团队规模

    专注于深度静态代码分析领域的鉴释今日宣布,已完成由将门创投及红点创投中国基金(红点中国)联合领投的A+轮融资。
    至顶网  业界供稿  2020-07-29 12:19:25  
  • HPE携手Tookitaki,为亚太地区金融机构提供反洗钱解决方案

    HPE GreenLake云服务强大而丰富的功能可以满足不同行业和企业的多元需求。近期,它又承载着由AI和机器学习驱动的解决方案,进入了一个相当“刺激”的领域——助力银行开展反洗钱调查。
    至顶网  HPE中国  2021-06-09 09:09:05  
  • 曙光“三大引擎”布局智能计算 获智能计算领军企业奖

    中科曙光大数据首席科学家、大数据智能研究院院长宋怀明博士应邀在主论坛上发表题为“智能计算驱动产业升级”的主题演讲。
    至顶网  至顶网服务器频道  2019-06-28 11:20:48  
  • 谷歌研究院揭秘:AI如何像人类一样思考推理

    谷歌研究院发现了一种让AI进行逻辑推理的新方法——思维链提示。通过要求AI先展示思考过程再给出答案,这种方法将AI在复杂数学问题上的准确率从10%提升至40%以上。这项技术不需要额外训练,只需改变提问方式,但仅在大规模模型上有效。研究揭示了AI具备比预期更强的推理潜力,为未来智能系统发展开辟了新道路。
    至顶网  科技行者  2025-08-22 15:10:11  
  • LG AI研究院发布韩国AI大模型专业能力最新测试基准:就像给AI考职业资格证一样严格

    LG AI研究院发布了两个全新的韩国AI专业能力测试基准KMMLU-REDUX和KMMLU-PRO,通过真实的职业资格考试题目评估AI的专业能力。研究发现AI在医学领域表现较好,但在法律等地域性强的专业领域仍有不足,为AI的专业化发展和实际应用提供了重要评估工具。
    至顶网  科技行者  2025-07-22 09:26:46  
  • AI语言模型遇到"混淆问题"时为何表现不佳?印度理工学院等联合研究揭示大模型推理盲区

    印度理工学院等机构研究发现,即使是最先进的AI模型如GPT-4o、Claude等,在面对间接表达、干扰信息或背景过载的"混淆问题"时,准确率会从70-80%骤降至25-40%。研究团队开发的ObfusQAte评估框架首次系统性揭示了大语言模型的这一重要缺陷,为改进AI推理能力和提高实际应用可靠性提供了重要基准。
    至顶网  科技行者  2025-08-18 13:59:16  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号