搜一下
用了 0.028408秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容2181 条
更快更智能:戴尔科技以全闪存技术助力企业实现高效网络恢复
网络威胁环境下,Dell APEX Protection Storage All-Flash for Cyber Recovery为企业提供快速、智能的还原能力。
至顶网
业界供稿 2024-10-09 16:42:37
长文本语言模型的可控性评估:人造生物故事让评估更全面、更可靠
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
至顶网
科技行者 2025-06-08 09:32:32
人工智能在数学奥赛中的巅峰突破:ByteDance团队让AI学会了使用代码工具
ByteDance研究团队提出ReTool框架,通过强化学习让大型语言模型学会在数学推理中战略性使用代码工具。该方法在AIME数学竞赛中达到67%
准确率
,比传统文本推理方法提升27个百分点,训练效率提高近3倍,展现了工具增强推理的巨大潜力。
至顶网
科技行者 2025-07-16 09:11:54
中科院团队首次让AI学会"看图反思":视觉推理模型不再"看一眼就算数"
中科院自动化所团队开发出Reflection-V视觉推理模型,首次让AI学会在推理过程中主动回顾检查图像信息。该模型通过创新的多智能体训练数据构建和视觉注意力奖励机制,解决了传统AI视觉推理中"看一眼就算数"的问题,在数学推理、多学科知识问答等任务上显著超越现有模型,甚至在某些测试中超过参数量大5倍的模型。
至顶网
科技行者 2025-09-28 13:46:56
浪潮信息发布大模型智算
软件
栈OGAI,为大模型创新打造高效生产力
8月24日,浪潮信息正式发布大模型智算
软件
栈OGAI。
至顶网
业界供稿 2023-08-25 16:12:18
阿里巴巴研究团队突破:让AI像程序员一样"检查代码"来纠正自己的错误
阿里巴巴研究团队开发出ProgCo方法,让AI像程序员一样生成验证程序来检查和纠正自己的答案。该方法在数学问题和指令遵循任务上表现卓越,
准确率
提升超过7%,同时具有比传统方法更高的计算效率,为AI自我纠错开辟了新的技术路径。
至顶网
科技行者 2025-09-12 19:47:08
锐思数智“遥感+AI”全场景解译自然密码
第二届光合组织AI解决方案大赛上,锐思数智的RS Matrix 遥感影像智能解译联合解决方案,全方位展示了“遥感+AI”在自然资源调查监管等领域的应用前景,同时也进一步体现出国产技术生态的强大潜力,给出了一条技术应用突围的新路径。
至顶网
业界供稿 2023-09-26 13:56:36
HumaniBench:一个从人性角度评估大型多模态模型的全新框架——Vector研究院和中佛罗里达大学联合打造的人机协作评测体系
HumaniBench是由Vector研究院和中佛罗里达大学联合开发的首个以人为中心的大型多模态模型评测框架,包含约3.2万对真实世界图像-问题对。与传统仅关注
准确率
的评测不同,它从公平性、伦理性、理解能力、推理能力、语言包容性、共情能力和鲁棒性七个维度全面评估模型的"人性化"程度。研究对15个顶尖多模态模型的测试显示,闭源商业模型总体领先,但在视觉定位和抗干扰性上存在短板;开源模型在特定能力上表现出色,但在平衡
准确率
与人性化原则方面面临更大挑战。
至顶网
科技行者 2025-05-27 17:00:27
中科大团队挑战AI视觉:让AI真正"看懂"世界,不只是回答问题
研究团队开发了IR3D-Bench基准测试,要求AI根据单张图片重建完整3D场景,以此检验AI是否真正理解所见世界。测试涵盖20多个顶尖AI模型,结果显示虽然AI在物体识别上表现出色,但在空间关系理解和尺寸估计方面存在明显不足。研究为评估AI视觉理解能力提供了新标准。
至顶网
科技行者 2025-07-03 16:24:32
上海交通大学研究团队破解AI生成图像识别难题:让机器像人类一样"看破"假图片并解释原因
上海交通大学研究团队开发出革命性AI图像检测系统,不仅能以98.1%
准确率
识别AI生成的假图片,更能像人类专家一样用自然语言详细解释判断依据并标出具体问题区域。该系统通过创新的多模态大语言模型训练方法,实现了从"黑盒判断"到"透明分析"的突破,为新闻、法律等领域提供可信赖的智能辅助工具。
至顶网
科技行者 2025-06-16 11:29:19
Sakana 推出全新 AI 架构 “Continuous Thought Machines” ,实现模型以更少指引进行推理 —— 类似人脑
本文介绍了 Sakana 针对语言模型提出的全新 CTM 架构,通过内部短时记忆和自适应运算,令模型推理更接近人类思考方式。
至顶网
VentureBeat 2025-05-13 17:26:54
南洋理工大学重大突破:AI智能助手终于学会"稳扎稳打"多轮推理,不再半路"掉链子"
新加坡南洋理工大学研究团队开发的SimpleTIR方法,通过识别并过滤"无效回合"解决了AI多轮推理中的稳定性问题。该方法让AI在AIME24数学测试中的
准确率
从22.1分跃升至50.5分,训练过程更加稳定,并让AI自动掌握了交叉验证、渐进推理和自我纠错等高级推理模式,为开发更可靠的AI助手提供了重要技术突破。
至顶网
科技行者 2025-09-24 13:56:04
NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍
NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。
至顶网
科技行者 2025-09-09 10:35:07
OpenAI全新发布o1模型 - 我们正式迈入了下一个时代。
OpenAI发布了新的AI模型OpenAI o1,它在复杂推理任务上取得显著进展,重置了命名序列。o1模型通过Self-play RL学习,具备了慢思考的特质,能够进行深度思考和推理。在AIME 2024数学竞赛和科学问题GPQA Diamond上,o1的表现超过了人类专家。o1模型已向ChatGPT Plus和Team用户开放,提供o1预览版和o1 mini两种版本,API价格不等。
至顶网
数字生命卡兹克 2024-09-14 22:04:28
SAKURA:探索大型音频语言模型如何"听懂"并"思考"——首个评估音频多跳推理能力的基准测试
台湾国立大学研究团队开发了SAKURA,首个专门评估大型音频语言模型多跳推理能力的基准测试。研究发现,即使最先进的模型也面临两大挑战:一是在识别某些音频属性(如情绪)时
准确率
不高;二是即使能正确识别音频信息,也难以基于这些信息进行多步推理。对比实验显示,当同样的信息以文本形式提供时,模型推理能力显著提升,表明当前模型未能有效整合音频表征进入推理过程,这为未来开发真正能"听懂并思考"的AI系统提供了重要方向。
至顶网
科技行者 2025-05-28 18:37:30
视角正确吗?用多维精细感知任务解析多模态大语言模型的方向理解能力
波士顿大学研究团队开发的DORI基准测试从四个维度评估多模态大语言模型的物体方向理解能力:正面对齐、旋转变换、相对方向和规范方向感知。研究评估了15个最先进模型,发现即使最佳模型在粗粒度任务上的
准确率
也仅为54.2%,在细粒度方向判断上更低至33.0%,与人类表现相差近30%。结果表明当前模型在精确角度估计、多视角追踪和理解复合旋转方面存在系统性缺陷,反映了它们内部3D空间表示的根本局限,为未来模型设计提供了明确方向。
至顶网
科技行者 2025-06-03 09:49:32
香港中文大学突破性成果:让相机像人眼一样精准"测距",AI终于学会了准确判断物体远近
香港中文大学团队开发的TR2M系统突破性地解决了计算机视觉中的距离测量难题,通过结合图像和文字信息,让AI既能在各种环境中通用工作,又能给出精确的距离数字。该技术参数量小、效果好,在室内外及医疗场景测试中均表现优异,为自动驾驶、机器人导航、增强现实等应用提供了重要技术支撑,代表了多模态AI融合的重要进展。
至顶网
科技行者 2025-06-23 11:46:03
Meta AI首次破解自回归图像生成的数字水印技术——像给AI生成的图片打上隐形身份证
Meta FAIR等机构首次成功将语言模型水印技术应用于自回归图像生成,解决了图像水印领域的关键技术难题——反向循环一致性缺失。通过专门的模型微调和水印同步层,实现了对AI生成图片的可靠来源追踪,
准确率
接近100%,且不影响图片质量。该技术在多个主流图像生成模型上验证有效,为AI内容监管提供了重要技术支撑。
至顶网
科技行者 2025-06-26 09:40:07
华为周跃峰:数据觉醒时代,共创数据存储产业新未来
3月14日至15日,以“因聚而生 数智有为”为主题的“华为中国合作伙伴大会2024” 在深圳隆重举行。华为数据存储产品线总裁周跃峰发表“数据觉醒时代,共创数据存储产业新未来”主题演讲。
至顶网
至顶网存储频道 2024-03-18 11:16:51
澳鹏Appen(中国)精彩亮相2024世界人工智能大会(WAIC2024)
高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始,澳鹏Appen(中国)已连续6届参与这一人工智能产业盛会,与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。
至顶网
业界供稿 2024-07-12 11:57:16
<
上一页
25
26
27
28
29
30
31
32
33
34
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号