用了 0.029122秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1873 条
  • 上海AI实验室团队提出LEGO-Puzzles:揭露多模态大模型在空间推理上的惊人短板

    上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
    至顶网  科技行者  2025-07-30 10:00:55  
  • 联通数科李广聚:以实景切入,助力中小企业滚动式完成数字化转型

    金风送爽,秋意渐浓。作为我国对外开放三大展会平台之一,2022年服贸会于9月1日在北京首钢园开幕。
    至顶网  业界供稿  2022-09-06 13:22:11  
  • VisTA:一种会学习选择视觉工具的人工智能,仿佛给视觉AI配了个聪明助手

    VisTA是一种新型强化学习框架,使视觉AI能够自主探索、选择和组合多种视觉工具。与传统方法不同,VisTA无需人工监督,通过反复尝试学习哪些工具最有效。研究团队在ChartQA、Geometry3K等测试中证明,VisTA显著优于训练免费基线,特别是在分布外样本上表现更佳。其核心创新在于使用群体相对策略优化算法,让AI代理能够根据实际性能而非预设规则来选择工具,为未来发展更灵活的视觉推理系统铺平了道路。
    至顶网  科技行者  2025-05-30 16:21:57  
  • OpenAI 新推理 AI 模型幻觉问题更严重

    OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。
    至顶网  Techcrunch  2025-04-21 17:11:40  
  • UNC Chapel Hill让AI变身万能专家:一个模型解决所有视觉推理难题

    北卡罗来纳大学教堂山分校研究团队提出MEXA框架,通过动态选择和聚合多个专业AI模型来处理复杂的多模态推理任务。该方法无需额外训练,在视频理解、音频分析、3D场景理解和医学诊断等多个基准测试中显著超越现有模型,为AI系统设计提供了新思路。
    至顶网  科技行者  2025-06-25 14:54:23  
  • 技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能

    以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
    至顶网  科技行者  2025-06-19 12:54:40  
  • 解决视觉语言模型的"眼见为实"难题:布朗大学团队开发像素与先验知识控制技术

    这项研究创建了"Visual CounterFact"数据集,通过展示与常识相悖的图像(如蓝色草莓)测试视觉语言模型如何平衡视觉输入与记忆知识。研究发现,模型往往会被视觉输入左右,即使被问及通用知识问题。团队开发了"像素与先验"转向技术,成功控制模型在两种信息源之间的依赖,颜色任务成功率高达92.5%,大小任务达74.6%,为构建更可靠的多模态AI系统提供了新工具。
    至顶网  科技行者  2025-06-06 14:14:03  
  • 大脑剖析:揭秘大语言模型的思维策略、预测与控制的全新方法——KAIST与卡内基梅隆大学研究团队发现

    这篇博文深入解析了KAIST与卡内基梅隆大学研究团队开发的COT ENCYCLOPEDIA框架,该框架能够自下而上地分析、预测和控制大语言模型的推理策略。研究显示,不同的推理策略对模型表现有显著影响,且这些策略主要由训练数据的格式而非内容领域塑造。通过引导模型采用最优策略,可提升模型准确率2.5%-8.3%,为AI系统优化提供了全新方向。
    至顶网  科技行者  2025-05-19 14:58:37  
  • 解锁电影的秘密:摄像机运动如何塑造你看到的每一帧画面

    想象一下,当你走在一条陌生的街道上,你会不自觉地移动你的头部和眼睛来感知周围的环境。你可能会抬头看看高楼,左右张望观察街道两侧的店铺,或者转身看看身后是否有车辆驶来。这种自然的观察方式实际上非常类似于电影中摄像机的运动方式。
    至顶网  科技行者  2025-04-29 12:18:29  
  • 让AI真正"看懂"并编辑图片:上海交大团队开创视觉推理新基准

    上海交大团队首次建立AI视觉推理评估标准RISEBench,测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度,揭示当前AI缺乏真正理解物理规律和逻辑关系的能力,为AI发展指明了从模式识别向深层推理转变的重要方向。
    至顶网  科技行者  2025-07-16 09:17:45  
  • 华南理工大学研究团队打造史上最大中文字符识别数据集,9万多个汉字让机器"慧眼识字"

    华南理工大学研究团队构建了迄今最大的中文字符识别数据集MegaHan97K,包含97,455个汉字类别和超过460万个样本,是此前最大数据集的六倍。该数据集首次完全支持最新的GB18030-2022中文标准,通过手写、历史文献和合成三个子集有效解决了长尾分布问题。实验表明,使用该数据集训练的模型性能显著提升,为古籍数字化保护和现代中文处理应用提供了强大技术支撑。
    至顶网  科技行者  2025-06-12 09:54:33  
  • 让大型AI模型减肥变身,马普所等机构打造"瘦身"版训练新方法

    德国马普所等机构提出OFTv2,一种更高效的AI模型训练方法。通过将计算从"权重中心"转为"输入中心",结合Cayley-Neumann参数化技术,实现了10倍训练加速和3倍内存节省。该方法还扩展到量化模型训练,创造了QOFT框架,在数学推理等任务上超越了流行的QLoRA方法,为大型AI模型的高效训练提供了新方案。
    至顶网  科技行者  2025-06-30 10:51:29  
  • 联想全球IT组织利用UiPath自动化技术加快HR数字化转型步伐

    企业自动化软件公司UiPath(纽交所代码:PATH)日前宣布,联想集团通过在全球范围内部署UiPath自动化技术,实现了生产力和效率的大幅提升。
    至顶网  业界供稿  2022-10-18 13:43:07  
  • Skywork OR1: 昆仑团队打造的增强推理能力开源大模型

    Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
    至顶网  科技行者  2025-06-02 16:33:24  
  • 新华三百业灵犀达国内先进水平!率先完成中国信通院大模型标准符合性验证

    近日,紫光股份旗下新华三集团打造的私域大模型百业灵犀(LinSeer)在中国信通院组织的大规模预训练模型标准符合性验证中,模型开发模块被评为4+,达到国内先进水平。
    至顶网  业界供稿  2023-09-21 17:51:21  
  • AI如何让屏幕上的文字变得栩栩如生:南京大学团队的神奇文字生成器

    南京大学团队开发的TextCrafter系统成功解决了AI图像生成中多文字准确渲染的技术难题。该系统采用三阶段策略:实例融合、区域隔离和文字聚焦,实现了73.7%的文字准确率,相比基础模型提升45%以上。同时创建了包含2000个复杂场景的CVTG-2K评测数据集,为该领域建立了新标准。作为无需训练的即插即用技术,TextCrafter在广告设计、内容创作等领域具有广阔应用前景。
    至顶网  科技行者  2025-07-17 09:23:47  
  • RM-R1:让AI评估变得更明智——将奖励模型转变为推理工具

    想象一下,你正在参加一场料理比赛,有两位评委。第一位评委只给你一个分数,而第二位评委会详细解释你的菜品在口感、创意和技巧上的表现如何,然后才给出最终评价。显然,第二位评委的反馈对于你改进厨艺更有帮助。伊利诺伊大学研究团队正是秉持这一理念,开发了能像第二位评委那样工作的AI评估系统。
    至顶网  科技行者  2025-05-07 10:27:38  
  • 港中文团队发布WebGen-Bench:让AI从零写网站,但最强模型正确率仅27.8%

    港中文团队发布首个AI网站生成能力基准测试WebGen-Bench,评估结果显示即使最强模型准确率仅27.8%,但通过专门训练的WebGen-LM-32B模型达到38.2%,为AI建站技术发展提供重要参考。
    至顶网  科技行者  2025-07-08 09:45:12  
  • AI人脸识别技术前景光明

    我们生活在一个AI能力有望超越人类大脑的时代下。
    至顶网  科技行者  2019-04-08 18:44:26  
  • 超强拾音+准确撰写+全能翻译 AI助推搜狗录音笔新品体验升级

    去年3月,搜狗推出了AI录音笔C1,一年后,搜狗全新的AI录音笔产品它们又来了!受疫情的影响,今日,搜狗公司在线上举办了名为“同舟共记”的AI录音笔新品发布会,此次发布会,搜狗除了正式发布S1、E1两款AI录音笔新品外...
    至顶网  陶婧婕  2020-02-26 18:21:07  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号