用了 0.312702秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容26991 条
  • OPPO研究团队突破AI智能体技术瓶颈:首个系统性评估框架让AI助手真正"智能"起来

    OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准,开发出模块化的OAgents框架,在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议,将智能体能力分为事实获取和逻辑推理两个维度,为行业提供了标准化的工具和方法,推动AI智能体研究走向科学化和规范化。
    至顶网  科技行者  2025-06-26 12:52:10  
  • Supermicro推出搭载全新第五代Intel Xeon 处理器

    作为AI、云端、存储和 5G/边缘领域的全方位IT解决方案制造商,宣布其基于工作负载优化X13系列服务器的机柜气冷和液冷解决方案开始支持最新第五代Intel Xeon处理器(原代号Emerald Rapids)。
    至顶网  业界供稿  2023-12-21 13:32:04  
  • 600家科技企业高管齐聚南山 鸿蒙生态即将进入全新阶段

    5月20日,来自全国600家科技企业的高管在 “鸿蒙生态万象新”原生应用合作交流会上聚集一堂。
    至顶网  业界供稿  2024-05-23 16:38:23  
  • StepFun公司联合中科院突破:让AI从"翻译错误"变身"数学家",准确率高达40.5%

    中科院联合StepFun公司开发了AI数学翻译系统StepFun-Formalizer,能将自然语言数学问题转换为严格的形式化数学语言。通过创新的四阶段训练方法,该系统在权威测试中达到40.5%准确率,超越所有现有专业和通用AI模型,为自动定理证明和数学教育等应用奠定基础。
    至顶网  科技行者  2025-08-12 10:09:17  
  • Supermicro推出搭载第3代Intel Xeon处理器、PCI-E 4.0 NVMe高速缓存

    适合高容量云端规模储存的全新Top-Loading和Simply Double存储系统,完整的 60 槽和 90 槽 4U 存储机型系列,通过容易维护的架构支持单节点、双节点、存储桥接槽或JBOD配置
    至顶网  业界供稿  2021-07-29 12:34:00  
  • Gartner:云计算仍然是最大的新兴业务风险

    根据Gartner最新的调查显示,云计算仍然是负责风险、审计、财务和合规方面的管理人员最担心的风险。
    至顶网  Gartner  2018-08-20 09:44:08  
  • Meta 海底电缆计划超越地球周长,助力 AI 创新

    Meta宣布计划建设一条海底电缆,连接印度、南非和巴西等新兴经济体与美国。这条50,000公里的电缆将成为世界上最长的电缆,采用最高容量的技术,旨在促进经济合作、数字包容和技术发展。尽管建设需要数年时间,但预计将提升全球高速连接的可及性,支持人工智能等创新技术的发展。同时,针对海底电缆的安全性也引发了关注。
    至顶网  Computer Weekly  2025-02-20 10:49:19  
  • Bench-V:首个评估多模态输出视觉推理能力的基准测试

    这项由清华大学领导的研究提出了Bench-V,首个专注于评估AI模型视觉推理中多模态输出能力的基准测试。通过803个涵盖数学、物理、计数和游戏的精心设计问题,研究揭示即使是最先进的OpenAI o3模型也仅达到25.8%准确率,远低于人类专家的82.3%。实验结果表明,仅增加模型规模或使用文本推理无法有效解决视觉必需推理问题,未来AI需要发展真正的多模态思维能力才能缩小与人类的差距。
    至顶网  科技行者  2025-05-29 10:23:50  
  • 大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍

    深圳大学、腾讯等机构联合提出ReDit方法,通过在离散奖励信号中添加随机噪音解决AI训练中的梯度不稳定问题。该方法将学习速度提升约10倍,在数学推理等任务上显著改善模型性能,为大语言模型训练提供了简洁高效的优化方案。
    至顶网  科技行者  2025-06-26 12:50:57  
  • 当AI也要学会"言行一致":腾讯与港大团队打造更聪明的视频理解模型

    腾讯与港大研究团队提出GRPO-CARE方法,解决AI视频理解中推理过程混乱的问题。通过创建SEED-Bench-R1基准测试和双重奖励机制,让AI在提高准确率的同时保持推理逻辑性,在最难测试中性能提升6.7%,推理一致性提升24.5%,为构建更可信的AI系统奠定基础。
    至顶网  科技行者  2025-06-30 10:20:41  
  • 长江存储推出PCIe 4.0固态硬盘PC300 灵活满足全场景应用需求

    2022年6月23日,长江存储推出新一代商用固态硬盘——PC300系列产品。
    至顶网  至顶网存储频道  2022-06-23 14:18:20  
  • 新思科技:软件安全之旅需要借助“他山之石”

    随着全球数字化转型的不断深入,软件安全也迎来了高速发展期。只有建立可信、健全的软件安全保障体系,才能筑牢数字经济的网络安全屏障。
    至顶网  业界供稿  2023-01-12 15:42:29  
  • 希捷发布《多云成熟度报告》:多云模式极具挑战,企业需深谙破解之道

    《多云成熟度报告》来自全球领先的海量数据存储基础架构解决方案提供商希捷科技(NASDAQ:STX),该报告表明,在多云环境中降低数据成本且最大化数据驱动的创新至关重要且极具可能。该报告也提供了相关措施与建议,帮助机构升级与改进。
    至顶网  业界供稿  2022-06-15 12:19:39  
  • RAVENEA: 哥本哈根大学团队开创多模态检索增强视觉文化理解新基准

    RAVENEA是哥本哈根大学研究团队开发的首个多模态检索增强视觉文化理解基准,集成了超过10,000份人工标注的维基百科文档,用于评估视觉语言模型的文化敏感性。研究发现,轻量级视觉模型在配备文化感知检索功能后,在文化视觉问答和图像描述任务上分别提升了至少3.2%和6.2%的性能,证明了检索增强方法在提升AI文化理解能力方面的有效性,为构建更具文化包容性的视觉AI系统开辟了新路径。
    至顶网  科技行者  2025-05-28 18:35:42  
  • 英特尔筹备出口友好型低功耗Gaudi 3 AI芯片,专供中国市场

    英特尔将推出两款专供中国市场的Gaudi 3 AI加速器,根据美国出台的制裁政策对性能做出大幅“阉割”。
    至顶网  至顶网计算频道  2024-04-15 10:25:18  
  • R2R:使用小型-大型模型令牌路由高效导航分歧推理路径

    最近来自清华大学、无限极AI和上海交通大学的研究团队提出了一种名为"通向罗马之路"(R2R)的创新方法,可以在小型和大型语言模型之间进行智能令牌路由。研究发现,小型模型与大型模型的推理路径差异主要源于少量"分歧令牌"。R2R方法只在这些关键令牌上使用大模型,其余时间使用小模型,既保证了推理质量,又提高了效率。实验表明,使用平均5.6B参数的R2R方法超越了14B参数模型的性能,同时提供了2.8倍的速度提升。
    至顶网  科技行者  2025-06-01 18:58:56  
  • 浪潮AS5500G2获得SPC-1™中端存储性能测试全球第一

    在存储性能委员会(Storage Performance Council, SPC)组织的SPC-1TM基准测试中,浪潮存储AS5500G2创下150万IOPS的评测值,系首次SPC-1TM中端存储评测性能记录突破百万,全球第一。
    至顶网  业界供稿  2018-10-08 11:55:07  
  • 长文本语言模型的可控性评估:人造生物故事让评估更全面、更可靠

    这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
    至顶网  科技行者  2025-06-08 09:32:32  
  • AI能否真正理解科学图表?耶鲁大学团队首次评估多模态模型的科学图表理解能力

    耶鲁大学团队构建了首个科学图表理解评估基准MISS-QA,测试AI模型解读科学论文示意图的能力。通过评估18个前沿模型发现,即使最先进的AI模型准确率也仅达78.3%,远低于人类专家的89%。研究揭示了AI在图表理解、信息检索和推理方面的五大弱点,为科学AI应用的发展提供重要参考。
    至顶网  科技行者  2025-07-22 10:20:58  
  • Microsoft 因低成本模型趋势调整全球 AI 数据中心扩张计划

    微软公司reportedly缩减了多个数据中心项目,这一决定发生在其宣布投资800亿美元建设AI数据中心三个月后。报道称,微软暂停或推迟了在澳大利亚、印度尼西亚、英国和美国多个州的项目。微软表示这反映了其战略的灵活性,但也可能与AI开发成本下降和新兴低成本模型趋势有关。这一举动引发了对AI行业发展方向的思考。
    至顶网  SiliconANGLE  2025-04-07 09:53:22  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号