用了 0.087104秒,为您找到宝马 棋牌 官方网站 全部 版本 網纸 YB233相关内容6826 条
  • IBM研究院带来语音理解新突破:让AI更懂人话的训练秘籍

    IBM研究院开发出群体相对策略优化(GRPO)方法来训练语音感知大语言模型,通过让AI生成多个答案并比较优劣进行学习,在语音问答和自动翻译任务上取得显著性能提升。实验显示该方法比传统监督微调效果更好,BLEU分数最高提升10.9%,为语音理解AI的发展开辟了新路径。
    至顶网  科技行者  2025-10-15 12:07:04  
  • 阿里巴巴团队的AgentScaler:让AI助手像人一样聪明地使用工具

    阿里巴巴通义实验室开发的AgentScaler是一个能够智能使用工具的AI助手模型系列。通过创新的两阶段训练和自动化环境构建技术,AgentScaler在多个权威测试中表现优异,40亿参数的小模型就达到了300亿参数模型的性能。该研究首次实现了大规模环境自动构建来提升AI智能体能力,为AI助手的实用化应用奠定了基础。
    至顶网  科技行者  2025-09-28 13:48:15  
  • 谷歌破解大型系统性能预测难题:用AI读懂复杂系统日志,让传统方法望尘莫及

    谷歌联合康奈尔大学等机构的研究团队开发出革命性的"文本到文本回归"方法,让AI直接阅读系统日志预测性能,在谷歌Borg集群上达到0.99的预测准确率,比传统方法精确100倍,将预测时间从18小时缩短至几秒钟。
    至顶网  科技行者  2025-07-02 10:59:12  
  • Yale研究团队突破传统:Table-R1开创表格推理的全新境界

    Yale大学自然语言处理实验室研发的Table-R1模型突破性地将推理时间缩放技术应用于表格推理任务。研究团队通过两种方法提升模型能力:从DeepSeek-R1模型的推理过程中学习,以及利用可验证奖励进行强化学习。实验表明,即使使用仅有7B参数的模型,Table-R1-Zero也能在13个表格推理基准测试中媲美甚至超越GPT-4.1等大型模型。该研究不仅证明了中小规模模型通过适当训练也能实现出色表现,还为数据分析、科学研究和决策支持系统等实际应用提供了新可能。
    至顶网  科技行者  2025-06-03 17:39:47  
  • 正交残差更新:为深度网络提供稳定高效的更新机制

    这篇研究论文提出了一种称为"正交残差更新"的新方法,解决了深度神经网络中标准残差连接的局限性。研究人员发现,在传统残差连接中,模块输出与输入流直接相加可能导致冗余特征学习。他们的创新方法将模块输出分解为平行和正交两个组件,仅保留正交部分进行更新,促使网络学习更丰富的特征表示。在ResNetV2和Vision Transformer等架构上的实验证明,这种简单修改显著提高了模型准确率和训练稳定性,在ImageNet-1k数据集上使ViT-B模型的表现提升了4.3个百分点。
    至顶网  科技行者  2025-05-28 20:28:17  
  • DeepResearchGym:一款免费、透明且可复现的深度研究评估沙盒,让研究者摆脱商业搜索API的束缚

    DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
    至顶网  科技行者  2025-06-01 19:00:03  
  • 混合云100问「决策篇」:为企业上云“掌舵”

    混合云并不是公有云与私有云的简单组合,而是将这两者进行了有效整合,实现了任务的统一调度和编排。
    至顶网  至顶网软件与服务频道  2020-09-17 18:16:16  
  • 你敢要它就有!至强6新品治好选择困难症

    单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
    至顶网  至顶网计算频道  2025-03-20 16:07:06  
  • 你敢要它就有!至强6新品治好选择困难症

    单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
    至顶网  科技行者  2025-03-20 16:09:22  
  • SimpleQA Verified:谷歌DeepMind发布更可靠的AI事实性评估新基准,揭示大模型"胡编乱造"的真实水平

    谷歌DeepMind发布SimpleQA Verified基准,通过严格筛选1000道测试题目和改进评分系统,更准确评估AI事实准确性。测试显示最先进的Gemini 2.5 Pro仅获55.6%准确率,揭示当前AI在事实知识方面仍有较大提升空间。该工具为AI研究提供了更可靠的评估标准,推动开发更值得信赖的AI系统。
    至顶网  科技行者  2025-09-19 11:04:58  
  • 一场数据架构变革正在来临

    现有数据架构难以支撑现代化应用的实现。
    至顶网  至顶网CIO与CTO频道  2021-12-21 18:29:35  
  • VFMTok:让AI图像生成告别"拖拉慢"的时代——香港大学团队的全新突破

    香港大学团队开发的VFMTok技术革新了AI图像生成领域,通过使用预训练视觉基础模型和区域适应性采样策略,仅用256个令牌就实现了超越传统方法的图像生成质量。该技术不仅将生成速度提升3倍,还在ImageNet基准测试中创造了2.07的新纪录,为AI图像生成的实际应用奠定了坚实基础。
    至顶网  科技行者  2025-07-21 11:36:52  
  • FAMA:意大利和英语的首个大规模开源语音基础模型

    意大利布鲁诺·凯斯勒基金会研究团队发布FAMA,首个遵循开放科学原则的英意双语语音基础模型。与Whisper等闭源模型不同,FAMA完全开放训练数据、代码和模型权重,在超过15万小时开源语音数据上训练。研究创建了包含1.6万小时伪标注数据的新数据集,实验表明FAMA性能可与现有语音基础模型媲美,同时速度提升8倍。这一突破不仅促进研究可重复性和公平评估,还为语音技术领域树立了开放科学新标准。
    至顶网  科技行者  2025-06-04 10:13:04  
  • GTC 巴黎|黄仁勋交出一份新工业革命的完整“蓝图”

    黄仁勋在巴黎GTC上,描绘出一副由AI工厂驱动新工业革命的完整“蓝图”。
    至顶网  毛烁  2025-06-12 15:45:16  
  • 大语言模型的"外挂"时代:Meta等机构揭秘为什么AI要学会借助工具而非死记硬背

    Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。
    至顶网  科技行者  2025-09-04 10:02:41  
  • 生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

    本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。
    至顶网  Forbes  2025-01-03 15:17:09  
  • 当机器人像人一样"看懂"世界:上海AI实验室让机器人在任何环境都能自由导航

    上海AI实验室联合多所知名高校开发的NavDP系统实现了机器人导航的重大突破。该系统仅通过虚拟环境训练就能让不同类型机器人在真实世界中自由导航,无需地图或预先调试。核心创新包括大规模虚拟数据生成、扩散模型轨迹规划和智能安全评估机制,实现了真正的跨平台零样本迁移,为机器人技术产业化奠定了重要基础。
    至顶网  科技行者  2025-07-09 11:54:05  
  • 全面融入AI与可持续性能力,IBM重推解决云转型最后一公里业务难题的黑科技产品

    IBM中国科技团队近日宣布在IBM混合云与AI解决方案的基础技术能力之上,重点推出帮助企业走好最后一公里、快速解决以上迫切业务难题的黑科技产品。
    至顶网  业界供稿  2022-12-19 10:58:06  
  • Meta团队发明"三人舞"注意力机制:让AI更聪明的秘密武器

    Meta研究团队发明了一种革命性的"三人舞"注意力机制,突破了传统AI只能处理两元关系的局限。这种新方法让AI能够同时分析三个元素间的复杂关系,在数学推理、编程和逻辑分析等任务上表现显著提升。更重要的是,新方法改变了AI的学习规律,能够用更少的数据获得更好的效果,为数据稀缺时代的AI发展指明了新方向。
    至顶网  科技行者  2025-07-04 17:21:58  
  • DeepSeek:用2048张GPU训练出最强大语言模型,揭秘硬件与AI软件协同设计的奇迹

    DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
    至顶网  科技行者  2025-07-09 15:46:30  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号