搜一下
用了 0.035378秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容1870 条
华为云AI院长峰会在黔举行 推动人工智能产学研创新发展
7月22日,第三届华为云AI院长峰会在贵安召开。多位中国工程院院士、中国科学院院士,以及来自国内近30所顶尖高校的60余名院长、教授、专家汇聚一堂,共同探讨人工智能发展的新趋势及新挑战,促进人工智能创新思想、技术、产业、应用、人才的集聚和落地。
至顶网
至顶网CIO与CTO频道 2022-07-22 17:20:16
蚂蚁智能凭证安全产品“光鉴”通过国家级机构测评,产品性能获权威认证
蚂蚁集团智能凭证安全产品全项通过信通院能力测评,获
最高
评级。
至顶网
至顶网软件与服务频道 2024-04-29 17:09:19
双头优化:一种简单高效的半监督式视觉-语言模型知识蒸馏方法
本研究提出了双头优化(DHO)框架,一种解决视觉-语言模型知识蒸馏中梯度冲突问题的创新方法。通过设计两个独立的预测头分别学习标记数据和教师信号,DHO有效缓解了传统单头方法中的梯度冲突,提升了特征学习质量。实验结果显示,DHO在ImageNet等11个数据集上一致超越基线方法,使用1%标记数据时较现有最佳方法提高了3%的
准确率
,同时参数量更少。此外,DHO支持推理时通过线性组合双头输出灵活调整模型表现,为半监督学习下的知识蒸馏提供了一种简单高效的解决方案。
至顶网
科技行者 2025-05-21 14:23:13
Pinecone 推出 AI 代理构建 API,简化 RAG 开发
Pinecone 推出了 Pinecone Assistant,一种 AI 智能助手构建 API 服务,旨在加速检索增强生成(RAG)应用的开发。该服务集成了向量搜索、模型编排和重排等功能,简化了 RAG 应用的构建过程。Pinecone Assistant 提供了优化的接口、自定义指令和多种文件格式支持,为开发者提供了灵活且高效的 AI 智能助手构建工具。
至顶网
BLOCKS & FILES 2025-01-24 17:14:58
NVIDIA团队揭秘:如何让AI既会解数学题又能写代码——AceReason-Nemotron 1.1的训练秘籍
NVIDIA研究团队揭示了训练AI模型同时掌握数学推理和编程能力的突破性方法。通过精心设计的监督学习和强化学习协同训练,他们发现仅用数学题训练就能显著提升编程能力。研究提出了温度调节、阶段性训练等关键技术,最终的AceReason-Nemotron 1.1模型在多项权威测试中达到业界领先水平,为AI跨领域能力发展提供了新范式。
至顶网
科技行者 2025-06-23 09:26:13
SHARE:一种基于小型语言模型的分层行动修正助手,助力文本到SQL转换
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成
准确率
,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
至顶网
科技行者 2025-06-07 08:29:51
马里兰大学等机构联合研究:AI视觉模型的"火眼金睛"训练法
马里兰大学等机构联合提出ViCrit训练法,通过让AI识别图片描述中的人工植入错误来提升视觉理解能力。该方法将传统的生成完整描述转换为精确的错误定位任务,使训练目标更加明确。实验显示经过训练的AI模型在幻觉减少和多项视觉推理任务上都有显著提升,同时研究团队还发布了ViCrit-Bench评估基准。这项研究为AI视觉训练开辟了新思路。
至顶网
科技行者 2025-06-19 12:55:24
商汤、清华、复旦等开源百亿级多模态数据集,可训练类GPT-4o模型
商汤科技等机构联合开源了百亿级图文交错数据集OmniCorpus,规模是现有数据集的15倍,包含86亿张图像和16,960亿个文本标记。OmniCorpus数据集在多语言、多类型数据抓取上进行了优化,提高了内容提取的质量和完整性。通过人工反馈和自动过滤规则,确保了数据集的高质量。在VQA和Image Captioning等测试中,基于OmniCorpus预训练的模型表现出色,对训练多模态大模型有重要帮助。
至顶网
AIGC开放社区 2024-09-02 16:04:28
南华理工大学团队破解文档问答系统评估难题:全新基准DOUBLE-BENCH让AI真正"读懂"复杂文档
南华理工大学等机构联合开发的DOUBLE-BENCH是首个面向真实场景的文档检索增强生成系统评估基准。该研究发现现有评估方法存在严重缺陷,无法准确反映系统真实能力。DOUBLE-BENCH包含3276个多语言多模态文档和5168个精心设计的问题,全面测试结果显示当前系统在检索
准确率
和多步推理方面仍有重大提升空间,并暴露了系统"过度自信"的问题。
至顶网
科技行者 2025-08-12 14:18:22
神州信息发布新一代智能实时金融反欺诈系统Sm@rtRAF
新兴的金融欺诈手段也层出不穷,并呈现产业化与组织化的态势,欺诈行为更具隐蔽性和蔓延性。巨大的欺诈风险已成为国内金融领域面临的最大挑战之一,全面提升反欺诈防控能力迫在眉睫。
至顶网
业界供稿 2020-01-19 14:12:52
通过"置信引导型数据增强"解决知识蒸馏中的协变量偏移问题
这项研究提出了一种名为ConfiG的创新方法,通过生成针对性的数据增强样本来解决知识蒸馏中的协变量偏移问题。研究团队利用教师模型和学生模型之间的预测差异,引导扩散模型生成那些能挑战学生模型的样本,从而减少模型对训练数据中欺骗性特征的依赖。实验表明,该方法在CelebA、SpuCo Birds和Spurious ImageNet数据集上显著提升了模型在缺失组别上的性能,为资源受限环境下的AI应用提供了实用解决方案。
至顶网
科技行者 2025-06-07 15:59:31
IBM利用机器学习诊断早发性阿尔茨海默氏症
科技巨头IBM周一表示,机器学习和人工智能(AI)可以用于取代现存的阿尔茨海默氏症侵入性及昂贵的检测。
至顶网
至顶网软件频道 2019-03-12 15:32:01
中国信通院公布知识计算产品测评结果 华为云推动重塑知识价值
8月16日-17日,2022年可信AI峰会在北京举办。
至顶网
业界供稿 2022-08-16 18:30:15
史丹福大学团队推出MedCaseReasoning:首个用真实病例评估和提升AI医疗推理能力的开源数据集
斯坦福大学研究团队开发了MedCaseReasoning数据集,这是首个专门评估人工智能与临床医生诊断推理一致性的开源数据库。现有医疗AI评估标准仅检验诊断
准确率
,忽视了推理过程质量。该数据集包含14,489个诊断问答案例,每个都附有真实临床推理,涵盖800多种医学期刊。研究发现顶尖AI模型在医疗推理方面表现有限,如DeepSeek-R1的诊断
准确率
仅48%,推理召回率仅64%。
至顶网
科技行者 2025-05-23 15:28:18
百度CTO王海峰:依托智能云,百度大脑AI大生产平台推动产业智能化
10月26日,第九届中国智能产业高峰论坛(CIIS 2019)在西安开幕。百度首席技术官、ACL/CAAI 会士王海峰出席峰会,并发表题为《AI大生产平台推动产业智能化》的演讲,全面介绍百度如何通过探索顶尖AI技术、打造AI大生产平台,助力产业智能化发展。
至顶网
业界供稿 2019-10-30 11:57:36
阿里巴巴让机器开口说话:Marco-Voice如何让AI既会模仿声音又能表达情感
阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统,能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术,系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统,为虚拟助手、内容创作和教育技术等领域提供了强大工具。
至顶网
科技行者 2025-08-13 09:23:03
人工智能学会"记忆"的秘密:瑞士EPFL研究团队的突破性方法让AI在长篇文档中精准找到信息
瑞士EPFL研究团队开发的PERK方法通过参数高效的测试时学习技术,让AI能够像人类一样将长文档信息编码到专门的记忆模块中,显著提升了长上下文推理能力。该方法在多项测试中表现卓越,不仅能处理比训练时长32倍的文档,还解决了传统AI的位置偏见问题,为处理复杂长文档提供了创新解决方案。
至顶网
科技行者 2025-07-18 10:07:05
分段优化:让大语言模型通过段级信用分配更高效地学习推理能力
这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO,用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落,并在段级粒度上估计优势,实现了更精确的信用分配和更准确的优势估计。SPO框架包含灵活段落划分、基于蒙特卡洛的段落优势估计和段落优势策略优化三个核心组件。研究团队基于此框架设计了SPO-chain和SPO-tree两个特定实例,分别针对短链思维和长链思维场景。
至顶网
科技行者 2025-06-09 09:41:19
小模型也能学会深度思考:UCLA团队让2B视觉AI实现类人推理突破
UCLA团队首次成功让20亿参数的小型视觉AI模型实现了类似DeepSeek R1的"啊哈时刻"现象。他们通过在未经指令微调的基础模型上直接应用强化学习,让模型学会了自我反思和深度推理,在视觉推理任务上取得了显著突破。研究还发现指令微调可能限制模型的推理能力发展,为AI训练方法提供了新的思路。
至顶网
科技行者 2025-08-01 10:15:14
视频数学问答:突破性基准测试,通过视频理解检验模型数学推理能力
这项研究推出了VideoMathQA,一个创新基准测试,专门评估人工智能模型在视频中的数学推理能力。不同于静态图像或文本基准,它要求模型在时间轴上整合视觉、音频和文本信息,模拟真实教学场景中的"多模态大海捞针"挑战。基准测试涵盖10个数学领域,视频长度从10秒到1小时以上,设计了三种推理挑战:直接问题解决、概念迁移和深度理解。对30个模型的评估显示,专有与开源系统的差距正在缩小,而模型成功不仅取决于规模,还受架构和训练质量影响。
至顶网
科技行者 2025-06-09 11:17:41
<
上一页
12
13
14
15
16
17
18
19
20
21
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号