搜一下
用了 0.017117秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容1362 条
斯坦福哈佛联合研究:AI学习策略转换背后的"理性选择"机制
斯坦福与哈佛研究团队通过创新的"层次贝叶斯框架",首次从理性分析角度解释了AI学习策略转换机制。研究发现AI会在"记忆型"和"理解型"两种策略间理性选择,转换规律遵循损失-复杂度权衡原理。该理论框架仅用三个参数就能准确预测AI在不同条件下的行为表现,为AI系统的可控性和可预测性提供了重要理论基础。
至顶网
科技行者 2025-07-02 11:00:18
AI在虚拟世界中的"英雄之旅":AIRI研究团队如何打造测试智能规划能力的全新战场
AIRI研究团队开发了HeroBench测试平台,在RPG风格虚拟世界中评估25个大型语言模型的长期规划能力。研究发现AI在复杂多步骤规划任务中表现差异巨大,顶级模型Grok-4达到91.7%成功率,但加入升级机制和干扰因素后性能显著下降。该研究揭示了传统学术测试无法反映的AI规划能力真实水平,为改进AI长期规划提供了重要基准。
至顶网
科技行者 2025-08-27 10:29:58
CPU、GPU、FPGA、AI芯片,各种XPU哪家强?一篇文章看懂芯片产业格局
展望未来,XPU市场将呈现百花齐放的局面,各种芯片在各自的赛道发挥自身独特的价值。同时各种计算架构之间在聚焦自身优势的同时,也在相互融合协同,形成了“你中有我,我中有你”的局面。
至顶网
李祥敬 2021-07-07 09:07:32
英伟达DGX Spark:小巧超算处理大模型的新选择
英伟达推出售价3000-4000美元的DGX Spark,号称"全球最小AI超算"。该设备搭载128GB内存,基于Blackwell架构的GB10芯片,虽然速度不及RTX 5090,但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调,在AI开发领域具有独特优势,但软件生态仍需完善。
至顶网
The Register 2025-10-15 10:54:57
当AI聊天助手遇上挑剔用户:Salesforce如何让机器真正理解你的心思
Salesforce AI Research联合伊利诺伊大学开发的UserBench研究揭示了当前AI助手的重大缺陷:尽管技术上表现出色,但在理解用户真实需求方面表现糟糕。最先进的AI模型完全满足用户需求的成功率仅20%,发现隐性偏好的能力不足30%。这项研究创建了专门的用户中心评估环境,为开发真正理解用户、能够成为人类理解型伙伴的AI助手指明了方向,标志着AI发展从"任务执行者"向"用户协作者"的重要转变。
至顶网
科技行者 2025-08-14 12:12:18
从“三驾马车”到“安全可持续” 戴尔科技全面开启现代化“新解法”
春季新品发布会上,戴尔科技从底层技术到终端应用的全方位创新得到了全面展示!
至顶网
毛烁 2025-04-25 13:25:25
TVP走进B站:探索互联网黑天鹅背后的高可用之墙
9月25日,腾讯云 TVP 走进 B 站,畅聊「高可用 VS 黑天鹅」的那些事儿,相信能给你一些不一样的启发。本文为本次活动精华总结。
至顶网
业界供稿 2022-10-12 17:49:21
阿里巴巴团队的AgentScaler:让AI助手像人一样聪明地使用工具
阿里巴巴通义实验室开发的AgentScaler是一个能够智能使用工具的AI助手模型系列。通过创新的两阶段训练和自动化环境构建技术,AgentScaler在多个权威测试中表现优异,40亿参数的小模型就达到了300亿参数模型的性能。该研究首次实现了大规模环境自动构建来提升AI智能体能力,为AI助手的实用化应用奠定了基础。
至顶网
科技行者 2025-09-28 13:48:15
Google发布Gemma 2 2B和Gemini 1.5 Pro,FLUX开源图像的新标杆,这就是这周的AI大新闻。
本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型,FLUX开源图像模型,Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一,支持音频和视频,Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],
至顶网
数字生命卡兹克 2024-08-05 20:04:27
CASS:跨越Nvidia与AMD的代码转译突破——来自MBZUAI的数据、模型与基准测试解决方案
MBZUAI和澳大利亚国立大学的研究团队开发了CASS,这是首个大规模跨架构GPU代码转译系统,实现了Nvidia和AMD之间的源代码和汇编级代码转换。该项目包含7万对验证代码对,展示了源代码转换95%和汇编转换37.5%的准确率,远超GPT-4o等商业基准。CASS生成的代码在85%以上的测试中保持了与原生代码相当的性能,并通过CASS-Bench提供严格的评估基准。所有资源已开源,为GPU代码可移植性开辟了新途径。
至顶网
科技行者 2025-06-09 07:22:22
全面融入AI与可持续性能力,IBM重推解决云转型最后一公里业务难题的黑科技产品
IBM中国科技团队近日宣布在IBM混合云与AI解决方案的基础技术能力之上,重点推出帮助企业走好最后一公里、快速解决以上迫切业务难题的黑科技产品。
至顶网
业界供稿 2022-12-19 10:58:06
中科大团队推出深度研究智能体新基准:机器也能像博士生一样写研究报告了?
中科大团队推出深度研究智能体评测基准DeepResearch Bench,包含100个跨22领域的博士级研究任务,创新性地设计了RACE和FACT双重评估框架,分别评判AI生成报告质量和信息收集能力。测试显示谷歌Gemini表现最佳,该研究为AI研究助手行业建立了首个科学统一的评估标准。
至顶网
科技行者 2025-06-20 09:29:26
硬科技智能“四重奏”
——“第12届中国硬科技产业链创新趋势峰会”
至顶网
毛烁 2024-10-28 18:27:17
对话谷歌出海创业加速器:打出“选赛道、找抓手和PMF”的组合拳
Polyverse联合创始人兼CGO邱子珺和大逐创新CEO林军峰,与谷歌出海创业加速器全球负责人Sami Kizilbash一起接受了科技行者的采访,探讨了中国企业出海的心得、谷歌出海创业加速器的赋能、不同国家创业者的特质等一系列话题。
至顶网
科技行者 2023-09-18 19:15:09
分析1000篇论文后,牛津大学团队发现AI的思考过程不可信
分析1000篇论文后,牛津大学团队发现AI的思考过程不可信
至顶网
至顶AI实验室 2025-07-11 18:13:20
混合线性注意力机制的系统性分析:当传统Transformer遇上创新"混血"架构——加州大学圣克鲁兹分校与字节跳动的突破性研究
这项研究通过训练72个不同配置的模型,系统分析了混合线性注意力架构的设计原则。研究发现独立表现最佳的线性注意力机制在混合架构中未必最优,并识别出选择性门控、分层递归和控制性遗忘是成功混合架构的三大关键要素。结果表明,采用3:1到6:1的线性与全注意力比例能够在保持性能的同时将内存使用量减少4-7倍。
至顶网
科技行者 2025-07-18 09:37:33
从阿里辞职后不再内卷——一位德国程序员的“躺平”之路
如果你是因为幻想着新生活的美好而移民,那你将必然失望,因为生活中的盐总是咸的,哪里都一样。 如果你是因为要逃离旧世界的痛苦而移民,那你几乎一定会幸福,因为那一时一地的苦难并不是普世价值。
至顶网
尼酱 2022-06-16 16:27:56
大语言模型为什么总是"学会"错误的东西?浙江大学研究团队找到了让AI更聪明的全新方法
浙江大学研究团队开发了CAT方法,通过在大语言模型的注意力机制中注入因果知识,解决AI容易学习虚假关联而非真正因果关系的问题。实验显示该方法显著提升了模型在新环境下的表现,如Llama模型准确率从64.5%提升至90.5%。这项创新为开发更可靠、具备真正推理能力的AI系统提供了新思路。
至顶网
科技行者 2025-09-26 12:21:19
“用智能,开启无限可能” 2024惠普商用AI战略暨AI PC新品发布会盛大举行,智领无界未来
“用智能,开启无限可能。”
至顶网
业界供稿 2024-05-09 19:10:53
会议观察 | 2023全球人工智能开发者先锋大会精彩回顾
2023全球人工智能开发者先锋大会在上海临港成功举办。
至顶网
孙硕 宿硕 2023-03-01 18:30:25
<
上一页
61
62
63
64
65
66
67
68
69
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号