搜一下
用了 0.029929秒,为您找到
大发
大小
单双
有人
带么罔芷
88pkee
驻测
相关内容2142 条
RAVENEA: 哥本哈根大学团队开创多模态检索增强视觉文化理解新基准
RAVENEA是哥本哈根大学研究团队开发的首个多模态检索增强视觉文化理解基准,集成了超过10,000份人工标注的维基百科文档,用于评估视觉语言模型的文化敏感性。研究发现,轻量级视觉模型在配备文化感知检索功能后,在文化视觉问答和图像描述任务上分别提升了至少3.2%和6.2%的性能,证明了检索增强方法在提升AI文化理解能力方面的有效性,为构建更具文化包容性的视觉AI系统开辟了新路径。
至顶网
科技行者 2025-05-28 18:35:42
自我反思助力AI成长:Writer团队提出强化学习优化模型自我纠错能力的突破性研究
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
至顶网
科技行者 2025-06-06 17:31:30
微软研究团队揭秘:AI推理模型为什么会在"多步思考"时犯糊涂?
微软和马萨诸塞大学研究团队通过系统分析六种AI模型在多跳推理任务中的表现,发现了AI推理中的普遍问题:过度跳跃、推理保真度随复杂性下降、以及正确答案与错误推理过程脱钩现象。研究建立了七种推理错误分类体系,并开发了自动化评估框架,为改进AI推理能力和构建可靠AI系统提供了重要指导。
至顶网
科技行者 2025-08-12 14:17:28
解析数字原住民:Gen Alpha网络语言如何挑战AI内容审核系统
这篇研究探讨了Alpha世代(2010-2024年出生)独特的数字通信模式如何挑战现有AI内容审核系统。研究者评估了四大AI系统(GPT-4、Claude、Gemini和Llama 3)以及人类审核员理解这一代专属语言的能力,特别关注隐蔽骚扰识别。研究创建了100个当代Alpha世代表达的数据集,发现即使是最先进的AI系统也难以理解Alpha世代快速演变的语言,特别是在语境依赖和隐蔽风险方面。
至顶网
科技行者 2025-05-23 15:31:07
亚马逊云科技助力涂鸦智能出海,家庭能源管理系统(HEMS)将成智能家居新沃土
今年6月,《财富》(中文版)发布“2023年值得关注的中国出海主力”盘点,在七个赛道中聚焦不断开拓新领域、影响力与日俱增的出海企业。
至顶网
业界供稿 2023-08-10 12:18:49
让AI像小孩玩游戏一样学会数学推理:约翰斯·霍普金斯大学研究团队的惊人发现
约翰斯·霍普金斯大学研究团队发现让AI通过玩贪吃蛇等简单游戏进行强化学习训练,竟能显著提升其在数学推理等完全不同任务上的表现。这种名为ViGaL的训练方法无需任何数学训练数据,却在多项测试中超越了专门用数学题目训练的AI模型,展现了游戏训练培养通用推理能力的巨大潜力。
至顶网
科技行者 2025-06-13 09:45:19
大模型学习推理的熵机制:理解为何大模型在强化学习中容易陷入熵崩塌
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
至顶网
科技行者 2025-06-02 16:34:12
北京大学团队打造TransMLA:让大模型推理速度飞跃10倍的神奇转换器
北京大学团队推出TransMLA技术,可将现有GQA架构语言模型直接转换为高效MLA架构,无需重新训练。该技术通过RoRoPE、FreqFold和BKV三项创新实现了最高10.6倍的推理速度提升,在93%内存压缩下仅需60亿词元微调即可恢复性能,为AI模型优化提供了经济实用的解决方案。
至顶网
科技行者 2025-08-22 11:01:07
Google Cloud分享:如何利用AI创造企业价值
本月 ,Google Cloud举行了高管论坛,与客户和合作伙伴讨论人工智能的最新进展。
至顶网
至顶网软件与服务频道 2023-07-07 16:51:50
沙特32B医疗AI突破:Gazal-R1凭借双阶段训练击败12倍大模型
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
至顶网
科技行者 2025-07-01 15:53:37
位置、位置、位置:云端数据安全与隐私的重要性
对企业及其客户而言,数据是最有价值的商业资产,他们必须保护数据免于遭受非授权访问。通过结合利用始终可用且安全的数据和富有洞见的数据分析,您可以推动业务创新,提高客户满意度和忠诚度,更重要的是,提高在市场上的竞争力。
至顶网
至顶网云计算频道 2021-03-01 18:23:29
对话百度智能云:区块链场景落地,我们有一套方法论
区块链与我们的日常生活走得越来越近,自然而然,其关注度也在不断攀升,入局者更是与日俱增。百度便是其中之一。
至顶网
高玉娴 2020-04-21 13:36:55
昇腾Ascend C编程入门教程(纯干货)
一文get昇腾Ascend C编程入门全部知识点,只需要了解C++编程、理解对列通信与内存申请释放机制、通过调用相应的计算接口与搬运接口,就可以高效写出运行在昇腾AI处理器上的高性能算子。
至顶网
至顶网软件与服务频道 2023-08-29 11:48:22
字节跳动发布Waver:让AI视频生成进入"专业级"时代,5-10秒1080p视频随心而动
字节跳动发布Waver AI视频生成模型,可根据文字描述生成5-10秒的1080p高清视频,支持文本生成视频、图片生成视频等多种任务。在权威测试中位列全球前三,特别擅长处理复杂运动场景如体育比赛等。团队采用创新的两阶段生成策略和统一架构设计,训练使用超过2亿视频片段,并将完整技术方案开源分享。
至顶网
科技行者 2025-08-29 09:30:50
紫光集团更新重启——新董事长李滨的全员信与产业观
近日,李滨以董事长的身份致信紫光集团全体员工,就紫光集团未来发展和新的企业文化与员工进行交流,以寻求“统一思想,齐心协力,共谋大计”。
至顶网
业界供稿 2022-07-13 17:58:40
解锁长文推理效率:首尔国立大学和成均馆大学开发的"推理路径压缩"技术让LLM思考更快更省资源
首尔国立大学和成均馆大学的研究者提出了"推理路径压缩"(RPC)技术,一种无需训练的方法,能够对大语言模型在推理过程中生成的冗余内容进行压缩。研究发现推理路径存在"语义稀疏性"——大量重复或多余的内容。RPC通过定期评估词元重要性并保留最关键部分,将QwQ-32B模型的推理吞吐量提高了1.60倍,同时准确率仅下降1.2%,并显著减少了内存消耗,解决了长序列生成的内存溢出问题。
至顶网
科技行者 2025-05-26 08:03:20
当上下文成为金子:上下文文档嵌入模型的评估与训练
这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表明,上下文感知嵌入显著提升检索性能,尤其在处理非自包含文本片段时,同时保持计算效率,对分块策略更具鲁棒性,并且在语料库规模扩大时表现更佳。这一研究为更智能的文档检索系统铺平了道路。
至顶网
科技行者 2025-06-05 09:34:35
抖音团队打造全新视觉语言AI:SAIL-VL2以小博大,2B参数也能媲美大模型
抖音SAIL团队联合新加坡国立大学开发的SAIL-VL2多模态AI模型,以2B-8B的紧凑参数实现了超越大型模型的性能。通过精心的数据筛选、渐进式训练和架构优化,在106个数据集测试中表现卓越,其中2B版本在4B以下开源模型中排名第一,8B-Thinking版本在推理任务上达到开源第一。该模型证明了"小而精"的发展路径,为AI技术的普及和高效部署提供了新思路。
至顶网
科技行者 2025-09-29 14:30:19
ByteDance智能创作团队推出划时代海报设计AI:CreatiPoster让人人都能成为设计师
ByteDance智能创作团队推出CreatiPoster,这是一个革命性的AI海报设计系统,用户只需文字描述就能生成专业级多图层可编辑海报。系统采用"双脑"架构:协议模型负责理解需求并制定详细设计方案,背景模型负责创造匹配的视觉背景。支持多种交互方式,包括纯文字输入、图片素材上传、画布编辑等。在与商业平台的对比评估中表现优异,并开源了10万样本数据集,真正实现了AI设计工具的民主化。
至顶网
科技行者 2025-06-18 09:53:30
中科大团队让AI用两张照片就能"看懂"整个3D世界:稀疏视角重建技术的革命性突破
中科大团队开发了MeshSplat技术,仅用两张照片就能重建完整3D场景。该技术首次将2D高斯散点应用于稀疏视角表面重建,通过加权距离约束和法向预测网络显著提升重建质量。实验显示其性能比现有方法提升30%,在房地产、电商、文物保护等领域具有广泛应用前景。
至顶网
科技行者 2025-09-02 09:31:47
<
上一页
69
70
71
72
73
74
75
76
77
78
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号