用了 0.038943秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2311 条
  • IBM研究院突破性发现:让AI搜索速度提升5倍的"智能偷懒"技术

    IBM研究院开发出Col-Bandit技术,这是一种能让AI搜索系统速度提升5倍的智能优化算法。该技术通过动态决策机制,只计算影响最终搜索结果的关键比较,跳过不必要的计算步骤。实验显示,在保持95%准确率的前提下,计算量可减少60-80%。该技术支持即插即用部署,无需修改现有系统,为解决现代搜索系统的计算资源浪费问题提供了实用解决方案。
    至顶网  科技行者  2026-02-11 13:00:50  
  • 上海AI实验室突破AI答案验证瓶颈:CompassVerifier让机器评判更精准

    上海AI实验室开发的CompassVerifier是一个轻量级但高精度的AI答案验证系统,能够准确判断AI模型回答的正确性。该系统通过构建包含132万样本的VerifierBench评测数据集,采用错误驱动增强等创新技术,在验证准确率上显著超越GPT-4等大型模型。CompassVerifier不仅可用于AI性能评测,还能作为强化学习的奖励模型,有效提升AI训练效率和效果。
    至顶网  科技行者  2025-08-08 13:01:15  
  • 不再让变压器"丢三落四":T-Tech团队揭示层间记忆如何让AI更聪明

    T-Tech团队发现传统AI变压器存在"表征崩溃"问题,即在深层处理中会逐渐忘记重要信息。他们开发了LIMe技术,让AI每层都能访问历史层信息,如同为AI配备"全能记忆库"。实验显示LIMe在相同计算成本下性能提升15.3%,复杂推理任务准确率提升8-30%,且额外开销仅0.08%。这项技术为提升AI效率提供了新思路。
    至顶网  科技行者  2025-08-20 18:08:27  
  • 新加坡国立大学推出IPV-BENCH:首个专门评估AI视频模型处理"不可能场景"的基准测试

    新加坡国立大学研究团队开发了IPV-BENCH,首个专门评估AI视频模型处理"不可能场景"能力的基准测试平台。研究发现,当前最先进的AI视频模型在生成和理解违反物理定律、生物规律等不可能场景时表现不佳,最好的生成模型成功率仅37.3%,理解模型在时间推理方面尤其困难,揭示了AI技术在创造力和复杂推理方面的重大局限性。
    至顶网  科技行者  2025-08-01 10:16:01  
  • 腾讯华为团队推出WorldCompass:AI世界模型的"指南针"让虚拟世界探索更精准

    这项由浙江大学、腾讯华为等机构联合开展的研究,开发出名为WorldCompass的AI训练框架,专门用于提升世界模型的交互精准度。该技术通过片段级训练、双重评价体系和负向感知算法三大创新,将AI执行复杂动作指令的准确率从20%大幅提升至55%,同时保持了良好的视觉质量,为虚拟世界交互应用奠定了重要技术基础。
    至顶网  科技行者  2026-02-10 15:36:47  
  • 宾州大学团队发明AI"追根溯源神器",让大模型无处藏身

    宾夕法尼亚州立大学研究团队开发的AttnTrace技术,通过分析AI大模型的内部注意力机制,能够快速准确地追踪影响AI回答的关键文本内容。该技术解决了传统方法效率低下和准确性不足的问题,在多项测试中表现卓越,为AI安全防护和可解释性研究开辟了新方向。
    至顶网  科技行者  2025-08-08 13:05:22  
  • 智护业务安全,华为云安全运营新品组合出击

    当云计算成为数字经济发展的重要支撑力量,企业纷纷通过上云进行数字化转型和智能化创新。
    至顶网  业界供稿  2021-07-21 14:11:22  
  • Testin 云测引领AI测试变革:从工具辅助到智能主导的代际升级

    软件定义世界的今天,AI 与软件工程的融合正重塑测试行业格局。中国人工智能产业发展联盟发布的《AI4SE 行业现状调查报告(2024 年度)》显示,65.75% 的企业软件研发智能化成熟度已达 L2 及以上水平,标志着 AI 技术在软件工程领域从概念验证迈向规模化落地。
    至顶网  至顶网软件与服务频道  2025-08-01 11:56:35  
  • 助力伙伴数字化升级,麒麟软件CentOS迁移方案实践分享

    在11月7日-9日举办的华为全联接大会2022上,作为华为2022 年度优秀合作伙伴之“openEuler最佳实践伙伴”,麒麟软件受邀参加此次大会,并在会上分享了麒麟软件在CentOS迁移方案方面的实践成果。
    至顶网  业界供稿  2022-11-11 18:10:55  
  • 三个可能会被计算机视觉技术改变的行业

    计算机视觉最主要的应用是面部识别,这种技术经常被用于安全和执法领域。但是,在本文中,我想介绍一些计算机视觉技术不太明显的用途。特别是以下的三个行业,可能会从这种技术趋势的发展中受益匪浅。
    至顶网  科技行者  2020-06-18 14:59:04  
  • Meta发布J1:通过强化学习激励LLM思考和做出更好的判断

    这篇研究介绍了Meta公司开发的J1系统,这是一种通过强化学习训练大语言模型进行评判的创新方法。J1将可验证和不可验证的提示转换为具有可验证奖励的判断任务,从而鼓励模型在做出决策前先进行思考。研究表明,J1在8B和70B参数规模下都超越了同等规模的现有模型,甚至在某些测试中超过了更大的模型如o1-mini和DeepSeek-R1。这种方法的核心创新在于不仅优化最终判断,还优化思考过程本身,使模型学会制定评估标准、生成参考答案并重新评估回答的正确性。
    至顶网  Hugging Face  2025-05-16 17:09:21  
  • 俄勒冈大学研究团队推出mSCoRe:让AI学会全球常识推理的"多语言考场"

    俄勒冈大学和Adobe研究团队开发了mSCoRe基准系统,专门测评AI在多语言环境下的常识推理能力。该系统首次将推理过程细分为十种基本技能,涵盖逻辑、情境和社会伦理三大类别,并创新性地引入动态复杂度扩展机制。通过对八个顶级大语言模型的全面测试,研究发现现有AI系统过度依赖单一推理模式,在文化敏感的社会常识判断上仍有显著不足。
    至顶网  科技行者  2025-09-09 10:12:38  
  • 拆解视频大语言模型评测基准:知识、空间感知还是真正的时序理解?苹果公司研究团队带来新分析框架

    这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
    至顶网  科技行者  2025-06-03 20:42:21  
  • 华中科技大学团队发明AI"视觉工具使用专家",让计算机像人类一样调用外部工具解决复杂视觉问题

    华中科技大学团队开发的ReVPT系统首次让AI学会像人类一样主动选择和使用视觉分析工具解决复杂问题。通过创新的两阶段强化学习训练,该系统能根据任务需求灵活调用物体检测、深度估计等专业工具,在多项国际测试中显著超越基础模型,部分指标甚至超越商业化产品,为AI视觉推理能力提升开辟了新路径。
    至顶网  科技行者  2025-09-23 11:05:31  
  • 联通数科李广聚:三年耕耘拉开5G+工业互联网序幕,未来前景可期

    8月31日-9月2日,2021世界5G大会在北京亦创国际会展中心举行。
    至顶网  业界供稿  2021-09-02 17:38:47  
  • 复杂场景下的AI视觉难题:清华、牛津联合发布史上最困难的视频分割挑战MOSEv2

    复旦大学联合牛津大学等机构发布MOSEv2数据集,这是目前最具挑战性的视频目标分割基准。数据集包含5024个复杂场景视频,涵盖恶劣天气、密集人群、目标消失重现等真实世界挑战。测试结果显示,包括SAM2在内的先进AI模型性能大幅下降,从理想数据集的90%+准确率降至50%左右,揭示了AI技术与实际应用需求的巨大差距。
    至顶网  科技行者  2025-08-12 14:15:25  
  • MatTools:香港大学研究团队打造全新材料科学大模型基准测试工具

    香港大学研究团队开发的MatTools是首个全面评估大语言模型在材料科学工具应用能力的基准测试框架。研究发现通用型大模型(如GPT-4o)显著优于专业材料科学模型;AI生成的文档作为检索源比原始代码或官方文档更有效;简单的自反思系统反而优于复杂的多代理架构。这项研究为AI辅助科学工具的设计提供了全新思路,强调"通才胜于专才"、"AI懂AI"和"简单更好"的原则,有望加速材料科学研究和技术创新。
    至顶网  科技行者  2025-05-21 14:28:51  
  • MIT和IBM联手创新:TANGO框架通过互促进方式强化大语言模型的推理能力

    麻省理工学院与IBM研究团队共同开发的TANGO框架通过强化学习同时训练大语言模型的生成器和验证器,实现双向互促进的能力提升。不同于传统方法使用固定验证器,TANGO的验证器随生成器共同演进,提供精确的步骤级反馈。实验证明,这种"探戈式"协作方式使模型在数学竞赛问题上平均提升25.5%,特别是在最具挑战性的AIME 2025竞赛上准确率翻倍。TANGO还将训练效率提高3.3倍,验证器在无需步骤级标注的情况下也达到了业界领先水平,为大语言模型的推理能力增强开辟了新思路。
    至顶网  科技行者  2025-05-27 15:32:45  
  • 阿里巴巴推出Visual-CoG:AI绘画终于学会"分步思考"了

    阿里巴巴推出Visual-CoG技术,首次让AI绘画学会"分步思考"。该技术通过语义推理、过程优化和结果评估三个阶段,显著提升了AI处理复杂描述的能力。测试显示,在计数、位置、颜色等关键指标上提升15-48%,特别是推理任务成功率达77.5%,为AI绘画的智能化发展开辟了新方向。
    至顶网  科技行者  2025-09-01 15:52:55  
  • 让AI文本生成像翻书一样快:香港理工大学等机构揭秘扩散语言模型的"未卜先知"能力

    香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。
    至顶网  科技行者  2025-09-03 14:11:21  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号