搜一下
用了 0.032560秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容2181 条
PHYSICO任务:让AI模型接受物理概念的"真理考验"——腾讯WeChat AI、香港科技大学与约翰·霍普金斯大学联合研究
腾讯WeChat AI、香港科技大学与约翰·霍普金斯大学联合开发PHYSICO测试,通过自然语言和抽象网格图案的双重考验,首次定量证实AI模型存在"随机鹦鹉"现象。研究发现,先进AI模型在文字描述物理概念时
准确率
达95%,但在理解抽象图案时仅25-45%,远低于人类90%水平,揭示了AI缺乏真正概念理解的根本局限。
至顶网
科技行者 2025-08-25 14:27:52
再度升级!云测数据智能驾驶解决方案2.0推动产业落地“加速跑”
8月24日-26日,ICVS中国自动驾驶博览会在上海举办,云测数据在ICVS智能座舱技术峰会上进行了“驶向智驾场景新时代,云测数据全新智能驾驶解决方案2.0详解”的分享。
至顶网
至顶网计算频道 2023-08-29 15:10:42
延庆大学联合多家机构发布视频大模型加速新技术:让AI看视频快三倍不掉链子
延庆大学联合多家机构开发出视频AI加速新技术,通过智能合并相似画面片段,让AI处理视频速度提升2-3倍,
准确率
几乎不变。该技术能自动识别视频中的冗余信息并进行压缩,特别适合长视频处理,为视频AI应用的广泛部署提供了实用解决方案。
至顶网
科技行者 2025-07-21 09:12:18
数学和代码推理力的关键数据特征是什么?上海交通大学团队用影响函数揭示跨领域学习的奥秘
上海交通大学研究团队利用影响函数揭示了数据特征如何刺激大型语言模型的数学和代码推理能力。研究发现高难度数学问题能同时提升数学和代码推理,而低难度编程任务对代码推理最有效。基于此,他们提出了"任务难度翻转"策略,使模型在AIME24
准确率
翻倍至20%。细粒度分析还显示,探索性思维行为对推理有积极影响,而数学推理偏好逻辑连接词,代码推理则强调结构化语法。这些发现为优化AI训练数据提供了重要指导。
至顶网
科技行者 2025-05-29 14:50:38
语音识别AI的"思维透视镜":aiOla团队首次揭开机器如何"听懂"人话的黑盒子
aiOla公司研究团队首次为语音识别AI装上"思维透视镜",系统揭示了AI将声音转化为文字的内部机制。研究发现编码器不仅处理声音还理解语义,AI内部"知道"的信息比输出的更多,幻觉和重复问题可被精确定位和预测。这项突破性工作为构建更可靠的语音识别系统提供了理论基础,推动了AI可解释性研究的发展。
至顶网
科技行者 2025-09-04 09:58:01
权威认证!微众银行人脸识别应用通过信通院“护脸
计划
”三项评测
近日,由中国信息通信研究院云计算与大数据研究所、可信人脸应用守护
计划
、中国通信标准化协会TC602联合主办的“2022年度护脸
计划
成果发布会”在云端顺利召开。
至顶网
业界供稿 2023-02-10 14:53:29
StepFun公司联合中科院突破:让AI从"翻译错误"变身"数学家",
准确率
高达40.5%
中科院联合StepFun公司开发了AI数学翻译系统StepFun-Formalizer,能将自然语言数学问题转换为严格的形式化数学语言。通过创新的四阶段训练方法,该系统在权威测试中达到40.5%
准确率
,超越所有现有专业和通用AI模型,为自动定理证明和数学教育等应用奠定基础。
至顶网
科技行者 2025-08-12 10:09:17
当AI也要学会"言行一致":腾讯与港大团队打造更聪明的视频理解模型
腾讯与港大研究团队提出GRPO-CARE方法,解决AI视频理解中推理过程混乱的问题。通过创建SEED-Bench-R1基准测试和双重奖励机制,让AI在提高
准确率
的同时保持推理逻辑性,在最难测试中性能提升6.7%,推理一致性提升24.5%,为构建更可信的AI系统奠定基础。
至顶网
科技行者 2025-06-30 10:20:41
R2R:使用小型-大型模型令牌路由高效导航分歧推理路径
最近来自清华大学、无限极AI和上海交通大学的研究团队提出了一种名为"通向罗马之路"(R2R)的创新方法,可以在小型和大型语言模型之间进行智能令牌路由。研究发现,小型模型与大型模型的推理路径差异主要源于少量"分歧令牌"。R2R方法只在这些关键令牌上使用大模型,其余时间使用小模型,既保证了推理质量,又提高了效率。实验表明,使用平均5.6B参数的R2R方法超越了14B参数模型的性能,同时提供了2.8倍的速度提升。
至顶网
科技行者 2025-06-01 18:58:56
AI能否真正理解科学图表?耶鲁大学团队首次评估多模态模型的科学图表理解能力
耶鲁大学团队构建了首个科学图表理解评估基准MISS-QA,测试AI模型解读科学论文示意图的能力。通过评估18个前沿模型发现,即使最先进的AI模型
准确率
也仅达78.3%,远低于人类专家的89%。研究揭示了AI在图表理解、信息检索和推理方面的五大弱点,为科学AI应用的发展提供重要参考。
至顶网
科技行者 2025-07-22 10:20:58
当AI模型遇到"转个身"的挑战:UNC Chapel Hill揭示多模态大语言模型的方向感困惑
UNC Chapel Hill研究团队发现,即使是GPT-5、o3等顶级多模态大语言模型也无法可靠识别图像旋转。通过RotBench基准测试,研究揭示这些AI模型虽能识别正常朝向和倒置图片,却完全无法区分90度与270度旋转,暴露出当前AI在基础空间推理方面的重大缺陷。
至顶网
科技行者 2025-08-27 10:30:47
易鑫集团人工智能团队获第一届“英特尔创新大师杯”深度学习挑战赛季军
近日,由阿里云联手英特尔主办的第一届“英特尔创新大师杯”深度学习挑战赛落下帷幕。经过激烈的线上角逐,易鑫集团旗下人工智能小组AI-Lab在“通用场景中文OCR文本识别任务”赛道上荣获季军。
至顶网
业界供稿 2022-01-04 18:04:11
英特尔神经拟态计算技术助力新加坡研究人员让机器人“有触觉”
新加坡国立大学(NUS)的两名研究人员,同时也是英特尔神经拟态研究社区(INRC)的成员发表了最新研究结果,表明在机器人领域,与基于事件的视觉和触觉感知相结合,英特尔神经拟态计算大有可为。
至顶网
业界供稿 2020-07-16 10:58:52
英特尔表示已可实时区分deepfakes与真实拍摄画面
英特尔公司宣称开发出一种AI模型,能够通过颜色的细微变化实时检测视频内容是否使用了deepfake技术。从结论来看,如果拍摄对象是真人,那么这种颜色变化会更为明显。
至顶网
至顶网计算频道 2022-11-16 16:22:50
干掉完美主义:多轮分解如何让大语言模型推理更高效
这项研究提出了"多轮分解"(MinD)方法,将大型推理模型的冗长思维链重构为结构化的多轮对话形式,每轮包含一个思考单元和一个答案。通过监督微调和强化学习相结合的训练策略,MinD在MATH等基准测试上实现了高达70%的标记使用量和首个标记延迟(TTFT)降低,同时保持了竞争性能。研究表明,传统推理模型中存在大量冗余思考过程,而MinD通过"完成比完美更重要"的理念,使模型学会生成更简洁高效的推理过程。
至顶网
科技行者 2025-05-29 14:48:32
腾讯混元图像2.0模型正式发布
5月16日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,在画面质感超写实的基础上,带来全新的AI生图交互体验。模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。
至顶网
至顶网CIO与CTO频道 2025-05-16 14:02:04
Sherlock:让视觉-语言模型学会自我纠错推理的突破
这项来自普渡大学的研究展示了一种名为Sherlock的创新框架,让视觉-语言模型具备自我纠错能力。研究者通过三阶段训练方法(SFT冷启动、轨迹级偏好训练和自我改进),使模型能像侦探一样发现并修正推理错误。仅使用20k标注数据,Sherlock在八项基准测试中超越了使用5-13倍数据量的现有模型,证明自我纠错不仅能提升AI可靠性,还能大幅降低训练成本。
至顶网
科技行者 2025-06-03 07:42:56
滴滴出席信息检索领域顶级会议SIGIR 分享智能交通经验
近期,信息检索领域顶级会议ACM SIGIR2018在美国密歇根安娜堡成功举办,滴滴技术团队深度参与了大会,并主办智能交通信息学专题讨论会,详细介绍了滴滴在出行领域的探索和实践并分享了产学研合作经验。
至顶网
科技行者 2018-07-16 18:09:59
江行智能升级推出虚拟电厂解决方案 助力资源调度优化及运营效率提升
近日,中国电力能源数智化践行者——江行智能正式升级推出虚拟电厂解决方案。
至顶网
科技行者 2023-09-19 21:37:31
夸克AI视觉技术迈向企业服务 黄锐华:手机扫描效果已超过传统扫描仪
大模型技术运用在扫描场景后已经发生两方面变化
至顶网
业界供稿 2024-01-15 11:37:21
<
上一页
8
9
10
11
12
13
14
15
16
17
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号