用了 0.037107秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2311 条
  • VLM-R3:区域识别、推理与优化,让多模态大模型实现更精准的思维链推理

    VLM-R3是一项由北京大学和阿里巴巴联合研发的突破性技术,它通过区域识别、推理和优化三大功能,使多模态大语言模型能够在推理过程中动态聚焦图像的不同区域。类似于人类在思考时会反复观察图像关键部分,VLM-R3通过创新的区域条件强化学习方法,大幅提高了视觉推理能力,在MathVista、ScienceQA等基准测试上表现优异,特别是在需要精细空间理解的任务中效果显著。
    至顶网  科技行者  2025-05-28 18:28:34  
  • Hugging Face 24 小时内复刻 OpenAI 的 Deep Research

    Hugging Face 的研究人员在 OpenAI 的深度研究功能发布 24 小时后,推出了一个名为“Open Deep Research”的开源 AI 研究代理。该项目旨在匹配深度研究的性能,同时将技术免费提供给开发者。Hugging Face 表示,虽然强大的 LLM 现在可以在开源中自由获取,但 OpenAI 并未透露深度研究背后的代理框架。因此,他们决定在 24 小时内重现其结果并开源所需的框架。
    至顶网  Arstechnica  2025-02-18 15:18:02  
  • VS-BENCH: 一项评估视觉语言模型在多智能体环境中战略推理和决策能力的全新基准测试

    VS-BENCH是清华大学和中国科技大学研究团队开发的首个多模态基准测试,专门评估视觉语言模型在多智能体环境中的战略推理和决策能力。研究涵盖八个视觉基础环境,包括合作型、竞争型和混合动机游戏,从战略推理和决策两个维度进行评估。实验结果显示,即使是最先进的视觉语言模型也存在明显不足,最佳模型在推理准确率上仅达47.8%,标准化回报率仅为24.3%。研究还发现模型在提取视觉信息、多智能体协作和战略均衡等方面存在明显短板,为未来研究指明了方向。
    至顶网  科技行者  2025-06-06 17:29:36  
  • 婴幼儿语音情感数据的智能分析:西安交通大学与昆明理工大学联合突破传统限制的榜样之作

    西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率,显著优于单一分类器。这项技术有望应用于智能婴儿监护和早期疾病筛查,为理解婴幼儿非语言表达开辟了新途径。
    至顶网  科技行者  2025-06-11 07:52:43  
  • PHYSICO任务:让AI模型接受物理概念的"真理考验"——腾讯WeChat AI、香港科技大学与约翰·霍普金斯大学联合研究

    腾讯WeChat AI、香港科技大学与约翰·霍普金斯大学联合开发PHYSICO测试,通过自然语言和抽象网格图案的双重考验,首次定量证实AI模型存在"随机鹦鹉"现象。研究发现,先进AI模型在文字描述物理概念时准确率达95%,但在理解抽象图案时仅25-45%,远低于人类90%水平,揭示了AI缺乏真正概念理解的根本局限。
    至顶网  科技行者  2025-08-25 14:27:52  
  • 再度升级!云测数据智能驾驶解决方案2.0推动产业落地“加速跑”

    8月24日-26日,ICVS中国自动驾驶博览会在上海举办,云测数据在ICVS智能座舱技术峰会上进行了“驶向智驾场景新时代,云测数据全新智能驾驶解决方案2.0详解”的分享。
    至顶网  至顶网计算频道  2023-08-29 15:10:42  
  • 延庆大学联合多家机构发布视频大模型加速新技术:让AI看视频快三倍不掉链子

    延庆大学联合多家机构开发出视频AI加速新技术,通过智能合并相似画面片段,让AI处理视频速度提升2-3倍,准确率几乎不变。该技术能自动识别视频中的冗余信息并进行压缩,特别适合长视频处理,为视频AI应用的广泛部署提供了实用解决方案。
    至顶网  科技行者  2025-07-21 09:12:18  
  • 数学和代码推理力的关键数据特征是什么?上海交通大学团队用影响函数揭示跨领域学习的奥秘

    上海交通大学研究团队利用影响函数揭示了数据特征如何刺激大型语言模型的数学和代码推理能力。研究发现高难度数学问题能同时提升数学和代码推理,而低难度编程任务对代码推理最有效。基于此,他们提出了"任务难度翻转"策略,使模型在AIME24准确率翻倍至20%。细粒度分析还显示,探索性思维行为对推理有积极影响,而数学推理偏好逻辑连接词,代码推理则强调结构化语法。这些发现为优化AI训练数据提供了重要指导。
    至顶网  科技行者  2025-05-29 14:50:38  
  • 语音识别AI的"思维透视镜":aiOla团队首次揭开机器如何"听懂"人话的黑盒子

    aiOla公司研究团队首次为语音识别AI装上"思维透视镜",系统揭示了AI将声音转化为文字的内部机制。研究发现编码器不仅处理声音还理解语义,AI内部"知道"的信息比输出的更多,幻觉和重复问题可被精确定位和预测。这项突破性工作为构建更可靠的语音识别系统提供了理论基础,推动了AI可解释性研究的发展。
    至顶网  科技行者  2025-09-04 09:58:01  
  • 权威认证!微众银行人脸识别应用通过信通院“护脸计划”三项评测

    近日,由中国信息通信研究院云计算与大数据研究所、可信人脸应用守护计划、中国通信标准化协会TC602联合主办的“2022年度护脸计划成果发布会”在云端顺利召开。
    至顶网  业界供稿  2023-02-10 14:53:29  
  • StepFun公司联合中科院突破:让AI从"翻译错误"变身"数学家",准确率高达40.5%

    中科院联合StepFun公司开发了AI数学翻译系统StepFun-Formalizer,能将自然语言数学问题转换为严格的形式化数学语言。通过创新的四阶段训练方法,该系统在权威测试中达到40.5%准确率,超越所有现有专业和通用AI模型,为自动定理证明和数学教育等应用奠定基础。
    至顶网  科技行者  2025-08-12 10:09:17  
  • 当AI也要学会"言行一致":腾讯与港大团队打造更聪明的视频理解模型

    腾讯与港大研究团队提出GRPO-CARE方法,解决AI视频理解中推理过程混乱的问题。通过创建SEED-Bench-R1基准测试和双重奖励机制,让AI在提高准确率的同时保持推理逻辑性,在最难测试中性能提升6.7%,推理一致性提升24.5%,为构建更可信的AI系统奠定基础。
    至顶网  科技行者  2025-06-30 10:20:41  
  • R2R:使用小型-大型模型令牌路由高效导航分歧推理路径

    最近来自清华大学、无限极AI和上海交通大学的研究团队提出了一种名为"通向罗马之路"(R2R)的创新方法,可以在小型和大型语言模型之间进行智能令牌路由。研究发现,小型模型与大型模型的推理路径差异主要源于少量"分歧令牌"。R2R方法只在这些关键令牌上使用大模型,其余时间使用小模型,既保证了推理质量,又提高了效率。实验表明,使用平均5.6B参数的R2R方法超越了14B参数模型的性能,同时提供了2.8倍的速度提升。
    至顶网  科技行者  2025-06-01 18:58:56  
  • AI能否真正理解科学图表?耶鲁大学团队首次评估多模态模型的科学图表理解能力

    耶鲁大学团队构建了首个科学图表理解评估基准MISS-QA,测试AI模型解读科学论文示意图的能力。通过评估18个前沿模型发现,即使最先进的AI模型准确率也仅达78.3%,远低于人类专家的89%。研究揭示了AI在图表理解、信息检索和推理方面的五大弱点,为科学AI应用的发展提供重要参考。
    至顶网  科技行者  2025-07-22 10:20:58  
  • 当AI模型遇到"转个身"的挑战:UNC Chapel Hill揭示多模态大语言模型的方向感困惑

    UNC Chapel Hill研究团队发现,即使是GPT-5、o3等顶级多模态大语言模型也无法可靠识别图像旋转。通过RotBench基准测试,研究揭示这些AI模型虽能识别正常朝向和倒置图片,却完全无法区分90度与270度旋转,暴露出当前AI在基础空间推理方面的重大缺陷。
    至顶网  科技行者  2025-08-27 10:30:47  
  • 易鑫集团人工智能团队获第一届“英特尔创新大师杯”深度学习挑战赛季军

    近日,由阿里云联手英特尔主办的第一届“英特尔创新大师杯”深度学习挑战赛落下帷幕。经过激烈的线上角逐,易鑫集团旗下人工智能小组AI-Lab在“通用场景中文OCR文本识别任务”赛道上荣获季军。
    至顶网  业界供稿  2022-01-04 18:04:11  
  • 英特尔神经拟态计算技术助力新加坡研究人员让机器人“有触觉”

    新加坡国立大学(NUS)的两名研究人员,同时也是英特尔神经拟态研究社区(INRC)的成员发表了最新研究结果,表明在机器人领域,与基于事件的视觉和触觉感知相结合,英特尔神经拟态计算大有可为。
    至顶网  业界供稿  2020-07-16 10:58:52  
  • 英特尔表示已可实时区分deepfakes与真实拍摄画面

    英特尔公司宣称开发出一种AI模型,能够通过颜色的细微变化实时检测视频内容是否使用了deepfake技术。从结论来看,如果拍摄对象是真人,那么这种颜色变化会更为明显。
    至顶网  至顶网计算频道  2022-11-16 16:22:50  
  • 干掉完美主义:多轮分解如何让大语言模型推理更高效

    这项研究提出了"多轮分解"(MinD)方法,将大型推理模型的冗长思维链重构为结构化的多轮对话形式,每轮包含一个思考单元和一个答案。通过监督微调和强化学习相结合的训练策略,MinD在MATH等基准测试上实现了高达70%的标记使用量和首个标记延迟(TTFT)降低,同时保持了竞争性能。研究表明,传统推理模型中存在大量冗余思考过程,而MinD通过"完成比完美更重要"的理念,使模型学会生成更简洁高效的推理过程。
    至顶网  科技行者  2025-05-29 14:48:32  
  • 新型设备或可突破AI内存瓶颈障碍

    研究人员开发出全新的批量RRAM技术,通过8层堆叠结构实现内存内计算,可运行持续学习神经网络。该技术摒弃传统丝状结构,采用整层电阻切换方式,具备64个电阻级别和兆欧姆范围。测试显示在可穿戴传感器数据分类任务中准确率达90%,有望解决AI模型的内存墙问题,特别适用于需要实时学习的边缘设备应用。
    至顶网  Spectrum  2026-02-10 15:24:29  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号