用了 0.037158秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2311 条
  • 规模法则让开源视觉语言模型比拼更公平:如何证明MaMMUT优于CLIP?

    这项研究首次通过规模法则全面比较了CLIP和MaMMUT两种视觉-语言模型,发现虽然小规模计算下CLIP表现更优,但随着计算资源增加,MaMMUT展现更强的扩展能力。研究在多种下游任务和不同开放数据集上验证了结果一致性,并基于发现训练了高性能的openMaMMUT-L/14模型。这种通过规模曲线而非单点比较的方法避免了片面结论,为模型与数据集的系统性评估提供了新范式。
    至顶网  科技行者  2025-06-10 09:25:10  
  • 英国曼彻斯特大学研究团队发现:AI语言模型竟然无法理解"高深的废话"

    曼彻斯特大学研究团队发现,尽管AI语言模型在多数任务中表现优异,但在理解"Drivelology"(一种表面荒诞但蕴含深意的语言现象)时却频频失误。研究团队构建了涵盖六种语言的1200多个样本数据库,通过四项测试发现AI模型难以掌握这类文本的讽刺意图和文化内涵,揭示了当前AI在语用理解方面的根本局限。
    至顶网  科技行者  2025-09-25 10:31:44  
  • 多模态通才:InfantAgent-Next如何让AI更智能地操作你的电脑

    InfantAgent-Next是一款突破性的多模态通用型AI助手,能通过文本、图像、音频和视频与计算机进行交互。不同于现有方法,它采用高度模块化架构,将基于工具和纯视觉的代理技术融为一体,让不同模型能逐步协作解决分散任务。在OSWorld视觉测试中达到7.27%的准确率,超越Claude-Computer-Use;同时在代码处理基准SWE-Bench和通用任务平台GAIA上也表现出色。其开源设计不仅提供了丰富工具集,还优化了鼠标点击定位和文件编辑功能,为AI自动操作计算机开创了新范式。
    至顶网  科技行者  2025-05-29 14:49:59  
  • OpenAI发布GPT-5.3-Codex-Spark快速推理编程模型

    OpenAI今日发布轻量版AI编程工具GPT-5.3-Codex-Spark,专为快速推理设计。该模型基于Cerebras公司的WSE-3芯片,推理速度提升25%,令牌消耗减半。除基础编程外,还可处理调试、部署、监控等开发任务。在Terminal-Bench 2.0基准测试中准确率达77.3%,超越前代模型。目前仅向ChatGPT付费用户开放,API接口即将推出。
    至顶网  SiliconANGLE  2026-02-13 14:13:11  
  • 全国人大代表丁国林:建议转化运用AI技术,促进媒体融合转型

    随着5G技术的大规模商用,视频流量将呈指数级增长,视频化表达已是大势所趋。但当前,我国媒体转型与发展正面临着发展瓶颈,主要表现在:低效率的视频生产方式制约了传统媒体向融媒体、智媒体转型;海量化的视频生产规模使内容审核更加复杂困难。
    至顶网  业界供稿  2020-05-26 10:26:53  
  • FLAME-MoE:探秘专家混合模型的秘密花园——卡内基梅隆大学打造全透明语言模型研究平台

    FLAME-MoE是卡内基梅隆大学团队开发的首个全透明混合专家语言模型研究平台,包含7个规模从3800万到17亿活跃参数的模型。它采用每层64位专家、top-8选择和2位共享专家的架构,公开所有训练数据、代码和检查点。实验显示,FLAME-MoE比相同计算量的密集模型提升3.4个百分点,并揭示了三个关键发现:专家逐渐专注于特定词汇子集,专家协同激活保持稀疏多样,路由行为在训练早期就趋于稳定。这一平台为MoE模型的系统研究提供了前所未有的开放基础。
    至顶网  科技行者  2025-05-30 11:17:16  
  • 十年磨一剑:新华三智能运维工具集的演变之路

    作为数字化解决方案的领导者,紫光股份旗下新华三集团以持续强化的创新能力,引领IT服务模式与技术演进,推动IT服务能力全面进化。
    至顶网  业界供稿  2022-07-26 17:01:00  
  • 突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

    西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
    至顶网  科技行者  2025-08-04 13:34:06  
  • 让电脑学会听懂世界:卡内基梅隆大学开发出通用音频理解神器OpenBEATs

    卡内基梅隆大学研究团队开发了OpenBEATs,首个完全开源的通用音频理解系统。它突破了传统音频AI只精通单一领域的局限,能同时处理音乐、环境声音和生物声音,参数规模达3亿。在25个数据集的测试中表现卓越,特别在生物声学领域的10个数据集中有6个获得最佳成绩。该系统还具备音频推理能力,能回答音频相关问题并生成描述,为生态监测、音乐分析等应用提供强大技术支撑。
    至顶网  科技行者  2025-07-24 16:26:30  
  • 一套脚本跑遍全平台,Testin云测以前沿自动化测试服务赋能企业伙伴

    Testin云测作为国内领先的AI测试服务商,凭借十余年技术积累与行业实践,正通过自动化测试解决方案推动企业降本增效,加速智能化升级进程。
    至顶网  至顶网软件与服务频道  2025-07-04 11:49:37  
  • 用在线强化学习进化图像生成技术:Flow-GRPO如何让AI更精准地理解你的需求

    想象一下,你对AI说:"给我画四个杯子",结果AI只画了三个,或者你要求"一只红狗",却得到了一只棕色的狗。这些"听不懂人话"的情况在当今最先进的文生图AI中仍然很常见。虽然目前的AI生成技术已经能创造出令人惊叹的图像,但在准确理解和执行具体指令方面,它们还存在明显的短板。
    至顶网  科技行者  2025-05-12 12:44:38  
  • GPT-4.5 企业版:其准确性和知识储备是否值得高昂成本?

    OpenAI推出的GPT-4.5企业版引发了争议,其高昂价格让许多人质疑其性价比。然而,作为OpenAI最大且最强大的非推理模型,GPT-4.5在知识储备、文档处理、任务规划等方面表现出色。尽管成本高昂,但随着推理成本的下降和未来潜在的强化学习训练,GPT-4.5仍有望成为企业应用的有力工具。
    至顶网  VentureBeat  2025-03-03 17:49:46  
  • 强化学习存在推理效率问题,阿里千问团队发明推理二八法则,解决AI选择困难症

    强化学习存在推理效率问题,阿里千问团队发明推理二八法则,解决AI选择困难症
    至顶网  至顶AI实验室  2025-06-05 18:19:12  
  • 环信机器人4.0发布:三大平台级更新+保险行业解决方案

    近日,在中科软科技战略投资环信签约仪式现场,环信CEO刘俊彦正式宣布环信机器人4.0对外发布。
    至顶网  业界供稿  2018-07-17 23:17:17  
  • 当AI遇上癌症诊断:上海交大团队如何让机器"看懂"细胞的秘密

    上海交通大学研究团队开发出革命性AI癌症诊断系统,通过深度学习技术分析50万张细胞图像,实现94.2%的诊断准确率,诊断时间从30分钟缩短至2分钟。该系统不仅能识别多种癌症类型,还具备解释性功能,已在多家医院试点应用。研究成果发表于《Nature Communications》,展示了AI在精准医疗领域的巨大潜力。
    至顶网  科技行者  2025-06-10 14:24:08  
  • DFIR-Metric:首个全面评估数字取证和事件响应能力的大语言模型基准测试集

    这项研究引入了DFIR-Metric,首个专门评估大语言模型在数字取证与事件响应领域能力的基准测试集。由阿布扎比技术创新研究院领导的国际团队开发的测试包含三个部分:700道理论多选题、150个CTF风格的实际挑战,以及500个基于NIST标准的磁盘与内存取证案例。研究测试了14种顶尖大语言模型,发现虽然它们在理论知识方面表现良好(最高达92.75%准确率),但在需要多步推理的实际取证任务中仍存显著差距(最佳模型仅能解决28%的任务)。
    至顶网  科技行者  2025-05-30 16:20:25  
  • 联想ThinkCloud医疗AI一体机解决方案,助力西藏战疫

    近日,西藏自治区山南市人民医院选用联想企业科技集团提供的“联想ThinkCloud医疗AI一体机解决方案”,以协助医院医疗救治专家组更快捷、更精准地做好疫情筛查工作。
    至顶网  业界供稿  2020-03-30 10:43:19  
  • 当AI推理变得更聪明时,速度却越来越慢:加州大学圣地亚哥分校找到了"双线程加速"的解决方案

    加州大学圣地亚哥分校研究团队提出"前瞻推理"技术,解决大型AI推理模型速度慢的问题。该方法通过多模型协作,在步骤级别进行推测而非逐词猜测,结合语义验证实现高质量加速。实验显示可达2.1倍加速且几乎不影响准确性,为推理加速突破了传统1.4倍的算法天花板。
    至顶网  科技行者  2025-06-30 10:22:52  
  • 超长序列,超快预测!深势科技联手阿里云,AI蛋白质预测再下一城

    强强联合,突破 AI 蛋白质预测模型推理性能瓶颈,支持最高 6.6k 长氨基酸序列蛋白质的预测计算,达到目前已知最优推理效果。
    至顶网  业界供稿  2022-09-05 17:49:15  
  • Mistral AI 推出代理框架以争夺企业市场

    法国 Mistral AI 发布了一套综合代理开发平台,通过集成代码执行、网页搜索和文档处理等功能,实现跨对话上下文的复杂业务流程自动化。
    至顶网  Forbes  2025-05-30 09:54:28  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号