用了 0.033393秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • 当你的母语说不出口:解锁AI多语言思维的权衡与挑战

    格罗宁根大学和哈佛大学的研究团队发现,当前大型推理模型在被要求用非英语语言"思考"时,面临严重的语言匹配与准确性权衡。他们通过评估六个先进模型,揭示即使最强大的32B参数模型也经常默认使用英语推理,而非用户指定的语言。提示黑客技术能将语言匹配率从45%提高到90%以上,但准确率会下降。这一发现对构建真正可信的多语言AI系统具有重要启示。
    至顶网  科技行者  2025-06-04 09:16:03  
  • 让人工智能学会复杂推理:清华大学等机构发布MARS2多模态推理基准挑战赛

    清华大学等机构组织的MARS2多模态推理挑战赛历时两个多月,76支知名团队参与,通过三个赛道全面考察AI在真实场景视觉定位、空间感知问答和广告视频推理等复杂任务上的能力,结果显示即使最先进AI模型表现仍不理想,为推动人工智能向真正智能化发展提供了重要基准和研究方向。
    至顶网  科技行者  2025-09-29 14:29:29  
  • 数字化转型赋能绿色金融发展

    邮储银行依托 “金睛“信用风险监控系统,收集、整理和分析政府和企业公开的环境信息,搭建环境信息数据库,依托公众环境研究中心(IPE)的动态环境绩效评价 (DEPA)解决方案,快速高效识别企业的环境信用风险,提升信贷管理的效率和效能。
    至顶网  至顶网CIO与CTO频道  2024-01-04 18:47:23  
  • 浙大联合蚂蚁集团揭秘:为什么开源AI在数据分析上总是败给商业模型?

    浙大联合蚂蚁集团通过系统性研究发现,开源AI在数据分析上表现不佳的根本原因是缺乏战略规划能力。研究团队通过精心设计的数据合成方法,成功提升了开源模型的表现,14B模型甚至能媲美GPT-4,证明了高质量训练数据比海量数据更重要,为开源AI在数据分析领域的发展指明了新方向。
    至顶网  科技行者  2025-06-27 11:44:40  
  • UC伯克利大学研究揭示:视觉语言AI模型竟然"视而不见",装作理解图像却偷偷依赖文字猜测

    UC伯克利大学研究团队发现,当前先进的视觉语言AI模型虽然拥有强大的视觉识别能力,但在实际应用中却无法有效利用这些视觉信息。研究通过对比AI视觉系统的直接表现与完整系统的表现,发现存在巨大的性能差距,AI往往依赖语言模型的偏向性而非真实的视觉感知来回答问题。这一发现揭示了AI系统中视觉-语言整合的根本性缺陷,为未来AI发展指明了新方向。
    至顶网  科技行者  2025-06-17 10:44:04  
  • 视觉语言模型的"线性推理瓶颈"——爱沙尼亚塔林理工大学揭示AI视觉推理的隐藏障碍

    爱沙尼亚塔林理工大学研究团队发现,先进AI视觉模型的问题不在于"看不清"图片,而在于"想不通"图片间逻辑关系。他们提出"线性分离天花板"概念,揭示了广泛存在的"线性推理瓶颈"现象,并证明通过针对性微调可以解决这一问题。研究为改进AI视觉推理能力提供了新思路。
    至顶网  科技行者  2025-07-21 09:12:03  
  • 数学天才都被AI算哭了!斯坦福大学推出史上最难数学考试,连最强AI模型都只能考42分

    斯坦福大学研究团队开发了史上最具挑战性的AI数学推理测试系统Putnam-AXIOM,基于威廉·洛威尔·普特南数学竞赛的522道大学级难题。测试结果显示,即使最强的AI模型也只能达到42%的正确率,远低于它们在传统测试中的表现。研究还创新性地引入了变形题目生成和教师强制准确率评估方法,有效识别了AI对训练数据的记忆依赖问题,为真实评估AI数学推理能力提供了新标准。
    至顶网  科技行者  2025-08-15 15:06:29  
  • 盛邦安全发布Web应用安全综合治理系统新版本,响应IPv6环境下的资产治理需求

    近日,盛邦安全发布了Web应用安全综合治理系统RayGate v3.0版本,新增了IPv6资产自学习、定制化策略模板、三级用户站点开通、篡改事件手机端查询等功能,
    至顶网  业界供稿  2019-12-12 15:31:07  
  • AITEE:电气工程领域的智能辅导代理,让学习电路变得像有私人家教一样简单

    AITEE是一款由德国康斯坦茨应用科学大学研发的电气工程智能辅导系统,结合大型语言模型和图神经网络技术,能够理解手绘和数字电路图,通过检索增强生成找到相关解决方法,并使用苏格拉底式对话策略引导学生独立思考。系统不仅能准确识别电路组件和结构,还能通过并行Spice模拟验证计算结果,有效解决了传统教育中的"教师带宽问题",为电气工程学生提供个性化、可扩展的学习体验。
    至顶网  科技行者  2025-06-02 19:19:42  
  • 医疗AI的"显微镜革命":西北工业大学团队发布首个超声影像专用智能助手EchoVLM

    西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。
    至顶网  科技行者  2025-09-30 14:59:23  
  • OPPO研究团队突破AI智能体技术瓶颈:首个系统性评估框架让AI助手真正"智能"起来

    OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准,开发出模块化的OAgents框架,在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议,将智能体能力分为事实获取和逻辑推理两个维度,为行业提供了标准化的工具和方法,推动AI智能体研究走向科学化和规范化。
    至顶网  科技行者  2025-06-26 12:52:10  
  • "真相神经元":探索大语言模型中的"诚实机制"——史蒂文斯理工学院揭秘AI如何区分真假

    史蒂文斯理工学院研究团队发现大语言模型内部存在"真相神经元",这些特殊神经元能够识别信息真实性,不受主题限制。研究通过积分梯度方法定位这些神经元,证明抑制它们会显著降低模型在真实性测试中的表现。实验表明,这些神经元主要分布在模型的中间层,且其影响可跨数据集泛化。这一发现为提高AI系统可信度提供了全新视角,有望促进更可靠的语言模型开发。
    至顶网  科技行者  2025-05-26 07:50:06  
  • 视觉能力媲美OpenAI,Meta发布Llama 3.2

    这是Meta首款能够理解图像和文本的旗舰视觉模型。
    至顶网  VentureBeat  2024-09-27 10:04:43  
  • 视觉世界中的定位强化学习:卡内基梅隆大学团队让AI"看"得更透彻

    卡内基梅隆大学研究团队开发了ViGoRL系统,通过视觉定位强化学习显著提升AI的视觉推理能力。该方法让模型将每个推理步骤明确锚定到图像的特定坐标,模拟人类注视点转移的认知过程。与传统方法相比,ViGoRL在SAT-2、BLINK等多项视觉理解基准上取得显著提升,并能动态放大关注区域进行细节分析。这种定位推理不仅提高了准确性,还增强了模型解释性,为更透明的AI视觉系统铺平道路。
    至顶网  科技行者  2025-06-04 10:13:58  
  • SynthRL:新加坡国立大学团队如何通过可验证数据合成提升视觉推理能力

    新加坡国立大学研究团队开发的SynthRL是一种创新的数据合成管道,旨在提升视觉语言模型的推理能力。该方法通过三阶段流程自动生成更具挑战性的训练数据:首先基于难度选择模型已掌握的简单问题,然后生成保留原始答案的更复杂变体,最后验证问题的正确性与难度增加。应用于MMK12数据集后,研究生成了3300多个高质量问题,并在五个视觉数学推理基准上实现显著性能提升,尤其在最困难的样本上效果最为明显。这一研究证明了智能数据合成在增强AI推理能力方面的重要价值,为视觉语言模型的进一步发展开辟了新途径。
    至顶网  科技行者  2025-06-06 17:28:14  
  • 导向“无人测试”新纪元,AI测试平台——Testin XAgent服贸会吸睛!

    软件开发的世界中,测试一直是一座难以彻底翻越的大山。它至关重要,却往往受限于人力、时间和技术门槛,成为产品迭代中隐蔽却关键的瓶颈。
    至顶网  至顶网软件与服务频道  2025-09-26 16:53:22  
  • G-FOCUS:迈向评估UI设计说服力的稳健方法

    想象一下:你是一家电商平台的设计师,正在设计一个产品详情页。你创建了两个版本:一个将"加入购物车"按钮设计得更大且颜色鲜艳;另一个则将按钮设计得较小但位置更靠上。哪个设计更能说服用户购买产品?传统做法是通过A/B测试来获取答案——将两个版本随机展示给不同用户,统计哪个版本带来更高的点击率或转化率。
    至顶网  科技行者  2025-05-13 15:29:13  
  • 腾讯AI实验室首创"平行思维":让AI像人类一样同时思考多个问题的训练新方法

    腾讯AI实验室开发出全球首个平行思维AI系统Parallel-R1,通过强化学习让人工智能掌握了类似人类的多角度同时思考能力。该系统在数学推理测试中表现显著提升,平均准确率提高8.4%,最高提升达42.9%。研究还发现AI会自然演化思维策略,从探索式转向验证式平行思维,展现出类似人类专家的认知发展轨迹。
    至顶网  科技行者  2025-09-24 13:56:17  
  • 人工智能学会了如何在探索与利用之间找平衡:中国人民大学提出的新训练方法让AI更聪明

    中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型,为AI训练方法论贡献了重要洞察。
    至顶网  科技行者  2025-08-18 14:00:18  
  • 深信服桌面云,让运维再简单一点

    相比于传统pc,桌面云赢得企业用户青睐的一大特性就是其省心便捷的运维能力。
    至顶网  业界供稿  2022-11-08 14:55:46  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号