用了 0.033279秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • 告别过度思考:浙江大学研究团队开发自制动力训练让大型语言模型更高效推理

    浙江大学研究团队开发的"自制动力训练"(Self-Braking Tuning,SBT)方法解决了大型语言模型在推理过程中的过度思考问题。该方法不依赖外部干预,而是培养模型自主识别冗余推理并适时终止的能力。研究者通过分析推理效率比率和过度思考标记比率,构建了两种数据策略:SBT-E(精确版)和SBT-D(动态版)。实验结果表明,经过训练的模型在多个数学基准测试上保持原有准确率的同时,将标记消耗减少了30%到60%,显著提高了推理效率。这项创新使AI系统能更像人类一样有效思考,为资源受限环境下的AI部署提供了新解决方案。
    至顶网  科技行者  2025-05-28 08:11:02  
  • 华为钱包构建创新体验 支持电子印章服务

    子印章是单位、个人实物印章在数字世界的延伸,将满足消费者在线安全认证、电子签章及信息加密保护的需求,覆盖金融交易、电子政务、电子合同签署以及公共生活中身份验证等场景。
    至顶网  业界供稿  2022-11-07 11:16:29  
  • 新基建推动形成数字时代的新产业生态 AI机器人需打造规模化产业集群

    6月11日,京东数科推出“产业AI公开课”第二季第三期,聚焦《新基建来了,AI机器人准备好了》话题,从产学研角度深度探讨AI机器人基于新基建背景下的未来发展方向。
    至顶网  京东数科  2020-06-12 14:47:19  
  • AI推理也能"画草图"?KAIST团队让大模型思考更高效

    KAIST研究团队开发出"思维草图"方法,让大型语言模型像人类专家一样进行简洁高效的推理。该方法通过三种认知启发的推理方式和智能路由系统,在15个数据集上实现平均73%的输出减少,同时保持甚至提升推理准确性,为AI应用的效率优化提供了重要突破。
    至顶网  科技行者  2025-07-31 09:58:42  
  • 杀疯了!诺贝尔又把化学奖颁给AI大模型,谷歌成最大赢家

    专业社区关注大语言模型(LLM)如AlphaFold的发展,其预测蛋白质结构的能力为科研带来革命,缩短新药研发周期。谷歌DeepMind的Demis Hassabis凭借AlphaFold获化学诺贝尔奖,展现AI在科学研究中的关键作用。AlphaFold-3的架构创新和预测准确性提升,使其能预测几乎所有生命分子结构。AI的进步让科研界思绪凌乱,考虑转行搞AI。
    至顶网  AIGC开放社区  2024-10-10 16:04:29  
  • “华为坤灵”重磅发布,与分销伙伴共创亿万商机

    2023年5月8日-5月9日,以“因聚而生 众志有为”为主题的“华为中国合作伙伴大会2023”在深圳举办。
    至顶网  业界供稿  2023-05-10 11:21:45  
  • 当AI遇上编程逻辑:达拉斯大学团队发现大模型在复杂指令执行上的"软肋"

    达拉斯德州大学和Zoom公司联合研究团队开发了LogicIFGen框架,用于测试AI模型执行复杂逻辑指令的能力。他们构建了包含426个任务的LogicIFEval测试集,对21个主流AI模型进行评估。结果显示即使是最先进的模型准确率也仅为85%,大部分模型低于60%。研究发现AI在控制流执行、状态跟踪等方面存在显著不足,具有思考能力的模型表现更好。
    至顶网  科技行者  2025-08-15 15:05:09  
  • 微软Phi-Ground:让AI助手真正看懂电脑屏幕的突破性技术

    微软研究院团队开发了Phi-Ground模型,解决AI助手无法准确操作电脑界面的关键问题。通过创新的两阶段策略和大规模数据训练,该模型在多项基准测试中创下最佳记录,准确率显著提升。研究涵盖了从数据处理到模型优化的完整技术链条,为构建真正实用的AI助手奠定重要基础,同时也提出了隐私保护等需要解决的挑战。
    至顶网  科技行者  2025-08-06 11:12:49  
  • 深度解析:腾讯混元团队《先走后跑》——利用强化学习实现大模型简洁推理的新突破

    腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
    至顶网  科技行者  2025-05-31 17:26:21  
  • 华为发布园区L3自动驾驶网络解决方案,打造“三零”数字化体验

    在华为伙伴暨开发者大会2022期间,华为面向企业发布园区L3自动驾驶网络解决方案,以“零等待、零中断、零风险”的网络服务为亮点,为企业园区网络带来全新的自动化管理和运维模式,全面加速企业数字化转型。
    至顶网  业界供稿  2022-06-17 11:26:37  
  • 微软研究院推出POML语言:让AI助手像使用模板一样聪明理解复杂指令

    微软研究院推出POML标记语言,通过标准化模板解决AI对话格式混乱问题。该系统将内容与样式分离,能根据不同AI模型偏好自动调整格式,测试显示可将准确率提升9倍以上。研究团队开发了配套工具,用户无需编程基础即可创建复杂AI交互场景,为人机高效沟通提供了新方案。
    至顶网  科技行者  2025-08-27 15:14:27  
  • 阿里云客服中心智能集成解决方案 可节省88%人工成本

    7月26日,阿里云正式发布客服中心智能集成解决方案,这是继“智能会话客服机器人—小蜜”上岗后,阿里云人工智能技术在客服领域的整体智慧集成。
    至顶网  阿里云  2018-07-27 16:36:17  
  • 视觉语言模型的"换位思考"能力:超越物体识别的挑战

    想象一下:当你开车时,你不仅要看到路上的情况,还需要猜测其他司机能看到什么。当你与朋友共同搬运一件大型家具时,你需要理解对方的视角以便协调动作。这种能力在人类中被称为"视觉视角采纳"(Visual Perspective Taking, VPT),它是我们社交互动和空间导航的基础。
    至顶网  科技行者  2025-05-09 13:37:00  
  • GPU推进阿里巴巴业务突破 为AI推理应用强势赋能

    杭州2018云栖大会,展现了云计算、大数据、人工智能蓬勃发展的技术生态。作为人工智能计算平台领导厂商,NVIDIA展示了最新GPU平台和基于GPU计算平台阿里巴巴在诸多业务上的创新应用。
    至顶网  业界供稿  2018-09-25 09:59:11  
  • FedSVD:使用自适应正交化技术提升LoRA在联邦学习中的隐私保护能力

    这项研究提出了FedSVD,一种在联邦学习环境中提升低秩适应(LoRA)微调效果的新方法。研究团队通过引入基于奇异值分解的自适应正交化技术,成功解决了差分隐私随机梯度下降(DP-SGD)与LoRA结合时导致的噪声放大问题。实验表明,FedSVD在GLUE基准测试上显著优于现有方法,特别是在严格隐私保护条件下性能更加稳定,为隐私保护型分布式AI训练提供了新的技术路径。
    至顶网  科技行者  2025-05-22 13:55:43  
  • 重新排列图像块,提升视觉模型性能:加州大学伯克利分校研究突破

    这项由加州大学伯克利分校研究团队开发的REOrder框架,通过重新排列图像块的处理顺序,显著提升了视觉模型性能。研究发现,传统的行主序排列并非最优选择,而通过信息论先验和强化学习寻找最佳排序,可在不修改模型架构的情况下,使ImageNet-1K分类准确率提升3.01%,卫星图像分类提升13.35%。这一发现挑战了传统认知,为视觉模型优化提供了一个全新且易于实施的方向。
    至顶网  科技行者  2025-06-04 09:17:16  
  • VLM-R3:区域识别、推理与优化,让多模态大模型实现更精准的思维链推理

    VLM-R3是一项由北京大学和阿里巴巴联合研发的突破性技术,它通过区域识别、推理和优化三大功能,使多模态大语言模型能够在推理过程中动态聚焦图像的不同区域。类似于人类在思考时会反复观察图像关键部分,VLM-R3通过创新的区域条件强化学习方法,大幅提高了视觉推理能力,在MathVista、ScienceQA等基准测试上表现优异,特别是在需要精细空间理解的任务中效果显著。
    至顶网  科技行者  2025-05-28 18:28:34  
  • Hugging Face 24 小时内复刻 OpenAI 的 Deep Research

    Hugging Face 的研究人员在 OpenAI 的深度研究功能发布 24 小时后,推出了一个名为“Open Deep Research”的开源 AI 研究代理。该项目旨在匹配深度研究的性能,同时将技术免费提供给开发者。Hugging Face 表示,虽然强大的 LLM 现在可以在开源中自由获取,但 OpenAI 并未透露深度研究背后的代理框架。因此,他们决定在 24 小时内重现其结果并开源所需的框架。
    至顶网  Arstechnica  2025-02-18 15:18:02  
  • VS-BENCH: 一项评估视觉语言模型在多智能体环境中战略推理和决策能力的全新基准测试

    VS-BENCH是清华大学和中国科技大学研究团队开发的首个多模态基准测试,专门评估视觉语言模型在多智能体环境中的战略推理和决策能力。研究涵盖八个视觉基础环境,包括合作型、竞争型和混合动机游戏,从战略推理和决策两个维度进行评估。实验结果显示,即使是最先进的视觉语言模型也存在明显不足,最佳模型在推理准确率上仅达47.8%,标准化回报率仅为24.3%。研究还发现模型在提取视觉信息、多智能体协作和战略均衡等方面存在明显短板,为未来研究指明了方向。
    至顶网  科技行者  2025-06-06 17:29:36  
  • 婴幼儿语音情感数据的智能分析:西安交通大学与昆明理工大学联合突破传统限制的榜样之作

    西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率,显著优于单一分类器。这项技术有望应用于智能婴儿监护和早期疾病筛查,为理解婴幼儿非语言表达开辟了新途径。
    至顶网  科技行者  2025-06-11 07:52:43  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号