搜一下
用了 0.044473秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容2143 条
CSVQA:中国团队打造超全面科学测评基准,挑战视觉语言模型的STEM推理能力
这篇研究介绍了CSVQA,一个专为评估视觉语言模型在STEM领域推理能力的中文多模态基准测试。该数据集包含1,378道涵盖物理、化学、生物和数学的问题,每题都要求模型分析科学图表并进行专业推理。实验评估了15种VLM,结果显示即使最强大的模型o1也仅达到49.6%的准确率,揭示了当前AI在科学推理方面的明显局限。研究还发现模型在不同学科表现不一,思维链提示效果因模型而异,为未来改进指明了方向。
至顶网
科技行者 2025-06-07 08:28:47
AI推理模型真的像宣传的那样聪明吗?Anthropic和Open Philanthropy研究人员揭露评测陷阱
Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
至顶网
科技行者 2025-06-18 17:44:59
AnyCap项目:清华大学团队打造的多模态字幕生成"魔法师",让AI精准理解你的个性化需求
清华大学团队推出AnyCap项目,通过轻量级"即插即用"框架解决多模态AI字幕生成缺乏个性化控制的问题。该项目包含模型、数据集和评估基准,能让现有AI系统根据用户需求生成定制化字幕,在不重训基础模型的情况下显著提升控制能力,为AI内容创作的个性化发展奠定基础。
至顶网
科技行者 2025-07-23 19:07:16
实现多LLM融合的动态选择框架:东北大学等机构突破大模型知识聚合的局限性
这项研究由东北大学、北京大学、哈佛大学和谷歌合作完成,提出了一种名为Fusion-X的创新框架,用于解决大语言模型知识聚合中的挑战。研究团队通过引入自适应选择网络、动态加权融合策略和反馈驱动损失函数,实现了多个异构LLM的高效集成,在不增加模型规模的情况下显著提升了性能,同时将知识干扰减少高达50%。实验结果表明,该方法在常识、推理和代码生成等多项任务上均优于现有方法,为LLM融合技术开辟了新方向。
至顶网
科技行者 2025-06-04 12:57:04
当AI像孩子一样学会自己纠错:MIT和哈佛联手揭示机器如何变得更聪明
MIT和哈佛研究团队发现,AI语言模型在自我评估能力方面存在显著问题,经常表现出过度自信或过度谦虚,无法准确判断自己答案的可靠性。研究揭示了AI校准偏差的深层机制,并提出改进方法。这一发现对AI在医疗、教育、商业等关键领域的应用具有重要意义,提醒我们需要更谨慎地评估AI建议的可信度。
至顶网
科技行者 2025-09-01 12:34:03
追求极致性能的巅峰对决 阿里云 vs AWS
为了对阿里云神龙服务器实际性能进行更深入地了解。下面我们就从基础性能、应用性能、大数据性能以及行业应用场景四个方面对阿里云神龙服务器与和它技术发展路线相近的AWS Nitro服务器进行一下测试。看看由千变万化的神龙,是否依然具备着裸金属的性能实力。
至顶网
董培欣 2021-10-21 12:42:27
SuperWriter:使用大型语言模型实现反思驱动的长篇文本生成
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
至顶网
科技行者 2025-06-08 09:32:16
Mergenetic:一款简单易用的进化式模型合并工具库|让普通GPU也能创造顶尖语言模型
Mergenetic是一个开源工具库,让研究人员能在普通GPU上进行进化式模型合并。由罗马萨皮恩扎大学和洛桑联邦理工学院研究者开发,它集成了19种进化算法和6种合并策略,支持数据集抽样以减少计算负担,并提供Python API、命令行和图形界面三种交互方式。通过案例研究证明,该工具能有效合并多语言模型和促进跨语言能力迁移,降低了高质量模型合并的技术门槛,使普通研究者也能创造出优秀的语言模型。
至顶网
科技行者 2025-05-21 14:11:16
AI的眼睛不会"看"?北京大学团队发现多模态大模型的致命视觉盲点
北京大学等七所院校研究团队通过"图灵眼测试"发现,包括OpenAI o1、Claude-4在内的15个顶级多模态AI模型在人类轻松完成的基础视觉任务上几乎全军覆没,成功率接近零。研究揭示问题根源在于AI视觉编码器的泛化能力缺陷,而非推理不足,为改进AI视觉系统指明了新方向,对自动驾驶、医疗影像等应用具有重要警示意义。
至顶网
科技行者 2025-07-28 15:31:53
国网黑龙江电力ERP“上云” 看青云QingCloud全维云赋能行业数字化转型
在全新架构之下,青云QingCloud联手合作伙伴,为黑龙江电力提供一整套完善的ERP迁移与测试方案,顺利帮助黑龙江电力实现了ERP“上云”。
至顶网
李祥敬 2020-03-06 17:27:21
思科Talos:VPNFilter更新——VPNFilter攻击终端并瞄准新设备
思科 Talos 与多家情报合作伙伴共同发现了有关 “VPNFilter” 的更多详细信息。在我们最初发布活动调查结果的几天里,我们已发现 VPNFilter 所瞄准的设备品牌/型号比最初想象得更多,而且还具有其他的功能,例如向终端进行攻击的能力。
至顶网
业界供稿 2018-06-08 16:17:59
英特尔多维发力,推动人工智能规模化发展
英特尔亚洲人工智能销售技术总监伊红卫也表示,在加速人工智能行业落地的过程中,英特尔可以从硬件、软件和生态三个方面进行赋能。
至顶网
李祥敬 2019-11-29 15:58:21
SophiaVL-R1:为多模态大语言模型注入思维奖励,让AI推理能力更上一层楼
SophiaVL-R1是香港中文大学和上海人工智能实验室联合开发的多模态大语言模型,创新性地引入了"思维奖励"机制来提升AI的推理能力。与传统方法不同,该研究不仅关注AI是否得出正确答案,还评估整个思考过程的质量,通过Trust-GRPO算法智能地整合思维奖励和结果奖励。实验表明,即使只有7B参数,SophiaVL-R1也能在MathVista、MMMU等多个基准测试中超越参数量大10倍的模型,证明了思维过程监督对提升AI泛化推理能力的重要价值。
至顶网
科技行者 2025-05-28 08:09:15
深度揭秘:算力创新竞技的拓荒者
在浪潮信息,有这样一群工程师们,他们在好奇心的驱动下,通过各种方式寻找算力提升的路径,无论进步
大小
,自豪感都在驱使着他们继续探索未知,甚至像一个科学家一样琢磨各种跨界的技术,并用于解决各类工程难题。
至顶网
业界供稿 2023-10-25 15:17:17
华为胡厚崑:疫情“关上了门”,创新“打开了窗”
在2021年世界移动大会·上海开幕式上,华为副董事长胡厚崑发表了《创新,点亮未来》的主题演讲。面对疫情给国家、地区、企业和个人带来的重大的影响,技术创新帮助全社会更好地应对了疫情冲击。
至顶网
至顶网大数据频道 2021-02-23 14:34:40
SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
至顶网
科技行者 2025-06-06 09:18:07
腾讯等研究机构突破性进展:如何让AI模型从简单题目中"造"出更难题目来提升推理能力
腾讯等机构提出Composition-RL方法,通过将多个简单问题组合成复杂问题来提升大语言模型推理能力。该方法解决了AI训练中"太容易题目"无效的问题,在4B-30B参数模型上获得3-10%性能提升,特别是跨学科组合训练效果显著,为AI训练资源高效利用提供新思路。
至顶网
科技行者 2026-02-13 21:52:07
打破界限:KAIST研究团队用SMILES解析器提升大语言模型对化学分子的理解能力
KAIST研究团队开发了CLEANMOL框架,解决了大语言模型理解SMILES分子表示法的关键难题。传统模型即使在简单任务如计数分子环数时也表现不佳,因为SMILES编码中结构信息常呈非连续分布。研究通过设计官能团匹配、环计数等确定性任务,大大提升了模型对分子结构的理解。实验表明,预训练后的模型在逆合成等下游任务上表现优异,精确匹配率从45.6%提升至58.1%。这一突破无需昂贵实验数据,为药物开发和材料设计提供了低成本高效的AI支持方案。
至顶网
科技行者 2025-05-30 15:07:48
任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话
任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话,认为还是要和大家勇敢地沟通,一起前进,战胜困难,我们要敢于走在时代前沿。
至顶网
至顶网数字化转型频道 2021-09-14 22:08:40
慕尼黑工业大学重磅发现:AI隐私保护与解释性能否双全?
慕尼黑工业大学研究团队首次系统性探讨了AI系统中隐私保护与解释性之间的关系,发现两者并非完全对立。通过对三种差分隐私方法和四种解释技术的大规模实验,研究证明在特定条件下适度隐私保护可提升解释质量,并提出了实用的平衡策略和"甜蜜点"配置方案。
至顶网
科技行者 2025-08-19 10:19:47
<
上一页
82
83
84
85
86
87
88
89
90
91
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号