用了 0.146199秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1383 条
  • 拼图解密:KU Leuven团队探索视觉拼图的强化学习之旅

    这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
    至顶网  科技行者  2025-06-05 11:05:15  
  • 2025年世界移动通信大会:NTT Docomo为超越5G的未来做准备

    日本领先的运营商 NTT Docomo 在 MWC 2025 会议上展示了下一代通信技术和服务的“基础性进展”,这些技术和服务将支持未来十年对网络基础设施的前所未有的需求。NTT Docomo 与 Toppan 签署协议,共同开发即将到来的 6G 时代的通信服务,Toppan 将其信息处理和计算机图形的专业知识应用于多种元宇宙服务。
    至顶网  Computer Weekly  2025-03-04 11:46:48  
  • MMSI-Bench:上海人工智能实验室打造的多图像空间智能新基准,揭示AI与人类空间认知的巨大差距

    上海人工智能实验室研究团队开发了MMSI-Bench,这是首个专注于多图像空间智能评估的全面基准。研究人员花费300多小时,从12万张图像中精心构建了1000道问题,涵盖了位置关系、属性和运动等多种空间推理任务。评测结果显示,即使最先进的AI模型也仅达到41%的准确率,远低于人类的97%,揭示了AI空间认知能力的重大缺陷。研究还识别了四类主要错误:物体识别错误、场景重建错误、情境转换错误和空间逻辑错误,为未来改进提供了明确方向。
    至顶网  科技行者  2025-06-04 10:15:03  
  • Fast-dLLM:NVIDIA研究团队通过KV缓存和并行解码实现扩散大语言模型的无训练加速

    NVIDIA联合麻省理工学院和香港大学的研究团队提出Fast-dLLM,一种无需重新训练即可显著加速扩散大语言模型的新方法。该技术通过两大创新解决了扩散模型的主要性能瓶颈:首先设计了适用于双向注意力机制的块式近似KV缓存,使模型能重用计算结果;其次提出基于置信度的并行解码策略,只解码超过阈值的高置信度词元。实验证明,Fast-dLLM在保持准确率的同时,能将LLaDA和Dream模型的推理速度提升高达27.6倍,彻底缩小了扩散模型与自回归模型之间的性能差距。
    至顶网  科技行者  2025-06-03 16:59:34  
  • 四家企业利用AI技术解决地球与太空中的垃圾难题

    当下,AI对部分问题的强大解决能力已经超越了科幻电影的范畴。垃圾识别、太空垃圾处理以及可持续发展正是其中的典型代表。
    至顶网  Forbes  2020-07-30 17:32:48  
  • 为AI而生 “智”臻架构激活企业AI新潜能

    浪潮商用机器有限公司宣布搭载全新OpenPOWER9处理器的FP5295G2服务器正式全面上市。专为企业级AI智慧计算创新优化设计……
    至顶网  浪潮  2018-10-12 16:47:41  
  • 云管端协同 华为布局AI力促智能社会发展

    根据华为EBG中国区智慧城市总工姚健奎的说法,“未来二三十年人类社会将演变成一个智能社会”,华为的愿景是“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。
    至顶网  业界供稿  2018-02-02 15:07:29  
  • 为AI而生 浪潮OpenPOWER FP5295G2服务器全面上市

    专为企业级AI智慧计算创新优化设计,FG5295G2凭借其卓越的整机性能、极简的AI架构和一流的训练加速能力,为现代HPC和人工智能提供无与伦比的驱动力,全面助力企业把握AI时代中的新机遇。
    至顶网  业界供稿  2018-09-17 09:50:32  
  • Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

    卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。
    至顶网  科技行者  2025-06-10 13:52:20  
  • 谷歌联合多校推出全球首个金融多语言多模态评测基准:让AI读懂全世界的财报和新闻

    这项由谷歌联合22所顶尖院校开发的研究首次推出了多语言多模态金融AI评测基准MultiFinBen,测试AI在五种语言和三种信息模态下的金融任务处理能力。结果显示即使最强的GPT-4o也只达到50.67%准确率,在多语言任务上仅7.50%,揭示了当前AI技术在实际金融应用中的严重不足,为行业发展指明了改进方向。
    至顶网  科技行者  2025-06-24 13:49:18  
  • 在消灭宫颈癌这件事情上,腾讯天衍实验室用AI做了重磅的研究

    宫颈癌是目前唯一病因明确、唯一可以早期预防和治疗、唯一可能基本消灭的癌症。
    至顶网  业界供稿  2021-06-09 08:27:10  
  • 重磅!新华三荣获国家科技进步奖

    紫光股份旗下新华三集团作为主要参与单位完成的两项产学研合作成果,凭借在关键技术领域的创新及重大突出贡献,成功斩获2023年度国家科技进步奖两项大奖。
    至顶网  业界供稿  2024-06-27 14:30:03  
  • 无需训练的视觉语言大模型推理与反思能力:武汉大学研究团队开创性FRANK模型让AI自我纠错

    武汉大学研究团队提出了FRANK模型,一种无需训练的方法,能让视觉语言大模型获得推理和反思能力。研究发现多模态模型中,浅层解码器负责视觉理解,深层负责文本推理,据此设计了一种层次化权重合并策略,将视觉模型与推理模型智能融合。他们通过泰勒展开推导出闭式融合权重公式,并引入注意力引导的指数衰减先验,使模型既保留视觉感知又获得推理能力。实验显示FRANK-38B在MMMU测试中达到69.2%准确率,超越GPT-4o,且展现出卓越的自我纠错能力,为多模态AI提供了无需昂贵训练的新途径。
    至顶网  科技行者  2025-05-28 07:37:57  
  • ScanBot:为什么康涅狄格大学研究团队认为机器人不仅需要抓取物体,还应精确扫描物体表面

    ScanBot是康涅狄格大学研究团队开发的首个专为高精度表面扫描设计的指令条件数据集,旨在解决机器人在精细工具使用方面的能力缺口。与传统数据集专注于抓取和导航不同,ScanBot关注亚毫米级精度控制,包含12个物体、6类任务和近900个扫描轨迹。研究评估了GPT-4、Gemini等大模型在参数选择、区域定位和轨迹生成方面的能力,发现即使最先进模型也难以满足工业扫描所需的精度要求,揭示了机器人智能向工具特定感知与控制发展的新方向。
    至顶网  科技行者  2025-05-29 12:04:11  
  • 告别复杂,回归简单:研究团队提出使用丰富数据和规则模型重新思考语音合成中的多音字处理

    这项研究解决了语音合成中的多音字问题,特别针对资源有限的波斯语。研究团队提出了两大创新:一是构建HomoRich数据集,为多音字消歧提供丰富素材;二是重新思考G2P系统设计思路,利用这些数据改进基于规则的模型。他们既提升了神经网络模型Homo-GE2PE的准确率,又创造了HomoFast eSpeak这一快速规则模型,两者均实现约30%的多音字识别准确率提升。研究结果特别有助于提高屏幕阅读器等辅助技术的使用体验,对视障用户尤为重要。
    至顶网  科技行者  2025-05-23 07:53:35  
  • 华为FusionPlant连续两年入选跨行业跨领域工业互联网平台

    近日,工业和信息化部正式公布2020年跨行业跨领域工业互联网平台遴选结果,华为工业互联网平台FusionPlant连续两年入选。
    至顶网  业界供稿  2020-12-29 10:26:19  
  • 医学人工智能守护生命之光:用算力与时间赛跑,推动医疗均质化

    在这个过程中,人工智能参与进来,辅助医生3分钟内完成影像数据分析,多学科一体化得出治疗方案对病人进行机械取栓手术,用最大努力把患者从终身瘫痪和死亡边缘拉了回来。依靠绿色通道、平台技术的支撑,他们打赢了这场“生命争夺战”。
    至顶网  业界供稿  2022-12-14 11:38:33  
  • 强化学习只是微调了大型语言模型中的小型子网络 — 伊利诺伊大学厄巴纳-香槟分校研究发现

    伊利诺伊大学厄巴纳-香槟分校研究发现,强化学习在微调大型语言模型时,实际上只更新了模型中5%-30%的参数,而非整个模型。这种"参数更新稀疏性"在各种RL算法和模型中普遍存在,且仅微调这个子网络就能达到与完全微调相同的效果。研究表明,训练数据与模型策略分布的接近程度是导致这种现象的主要原因,为未来开发更高效的RL训练方法提供了新思路。
    至顶网  科技行者  2025-05-28 07:39:46  
  • BBC内部访谈:驱动技术创新在BBC

    BBC 的研发团队致力于利用技术为公共利益服务,从内容真实性验证、沉浸式媒体体验到 AI 语音转文字系统,实现跨行业创新,造福社会。
    至顶网  Computer Weekly  2025-05-21 09:49:19  
  • CASS:跨越Nvidia与AMD的代码转译突破——来自MBZUAI的数据、模型与基准测试解决方案

    MBZUAI和澳大利亚国立大学的研究团队开发了CASS,这是首个大规模跨架构GPU代码转译系统,实现了Nvidia和AMD之间的源代码和汇编级代码转换。该项目包含7万对验证代码对,展示了源代码转换95%和汇编转换37.5%的准确率,远超GPT-4o等商业基准。CASS生成的代码在85%以上的测试中保持了与原生代码相当的性能,并通过CASS-Bench提供严格的评估基准。所有资源已开源,为GPU代码可移植性开辟了新途径。
    至顶网  科技行者  2025-06-09 07:22:22  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号