搜索 mg性价比最高的高达【網纸——YB233典CN—

斯坦福哈佛联合研究：AI学习策略转换背后的"理性选择"机制

斯坦福与哈佛研究团队通过创新的"层次贝叶斯框架"，首次从理性分析角度解释了AI学习策略转换机制。研究发现AI会在"记忆型"和"理解型"两种策略间理性选择，转换规律遵循损失-复杂度权衡原理。该理论框架仅用三个参数就能准确预测AI在不同条件下的行为表现，为AI系统的可控性和可预测性提供了重要理论基础。

至顶网科技行者 2025-07-02 11:00:18

AI在虚拟世界中的"英雄之旅"：AIRI研究团队如何打造测试智能规划能力的全新战场

AIRI研究团队开发了HeroBench测试平台，在RPG风格虚拟世界中评估25个大型语言模型的长期规划能力。研究发现AI在复杂多步骤规划任务中表现差异巨大，顶级模型Grok-4达到91.7%成功率，但加入升级机制和干扰因素后性能显著下降。该研究揭示了传统学术测试无法反映的AI规划能力真实水平，为改进AI长期规划提供了重要基准。

至顶网科技行者 2025-08-27 10:29:58

CPU、GPU、FPGA、AI芯片，各种XPU哪家强？一篇文章看懂芯片产业格局

展望未来，XPU市场将呈现百花齐放的局面，各种芯片在各自的赛道发挥自身独特的价值。同时各种计算架构之间在聚焦自身优势的同时，也在相互融合协同，形成了“你中有我，我中有你”的局面。

至顶网李祥敬 2021-07-07 09:07:32

英伟达DGX Spark：小巧超算处理大模型的新选择

英伟达推出售价3000-4000美元的DGX Spark，号称"全球最小AI超算"。该设备搭载128GB内存，基于Blackwell架构的GB10芯片，虽然速度不及RTX 5090，但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调，在AI开发领域具有独特优势，但软件生态仍需完善。

至顶网 The Register 2025-10-15 10:54:57

当AI聊天助手遇上挑剔用户：Salesforce如何让机器真正理解你的心思

Salesforce AI Research联合伊利诺伊大学开发的UserBench研究揭示了当前AI助手的重大缺陷：尽管技术上表现出色，但在理解用户真实需求方面表现糟糕。最先进的AI模型完全满足用户需求的成功率仅20%，发现隐性偏好的能力不足30%。这项研究创建了专门的用户中心评估环境，为开发真正理解用户、能够成为人类理解型伙伴的AI助手指明了方向，标志着AI发展从"任务执行者"向"用户协作者"的重要转变。

至顶网科技行者 2025-08-14 12:12:18

从“三驾马车”到“安全可持续” 戴尔科技全面开启现代化“新解法”

春季新品发布会上，戴尔科技从底层技术到终端应用的全方位创新得到了全面展示！

至顶网毛烁 2025-04-25 13:25:25

TVP走进B站：探索互联网黑天鹅背后的高可用之墙

9月25日，腾讯云 TVP 走进 B 站，畅聊「高可用 VS 黑天鹅」的那些事儿，相信能给你一些不一样的启发。本文为本次活动精华总结。

至顶网业界供稿 2022-10-12 17:49:21

阿里巴巴团队的AgentScaler：让AI助手像人一样聪明地使用工具

阿里巴巴通义实验室开发的AgentScaler是一个能够智能使用工具的AI助手模型系列。通过创新的两阶段训练和自动化环境构建技术，AgentScaler在多个权威测试中表现优异，40亿参数的小模型就达到了300亿参数模型的性能。该研究首次实现了大规模环境自动构建来提升AI智能体能力，为AI助手的实用化应用奠定了基础。

至顶网科技行者 2025-09-28 13:48:15

Google发布Gemma 2 2B和Gemini 1.5 Pro，FLUX开源图像的新标杆，这就是这周的AI大新闻。

本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型，FLUX开源图像模型，Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一，支持音频和视频，Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell]，

至顶网数字生命卡兹克 2024-08-05 20:04:27

CASS：跨越Nvidia与AMD的代码转译突破——来自MBZUAI的数据、模型与基准测试解决方案

MBZUAI和澳大利亚国立大学的研究团队开发了CASS，这是首个大规模跨架构GPU代码转译系统，实现了Nvidia和AMD之间的源代码和汇编级代码转换。该项目包含7万对验证代码对，展示了源代码转换95%和汇编转换37.5%的准确率，远超GPT-4o等商业基准。CASS生成的代码在85%以上的测试中保持了与原生代码相当的性能，并通过CASS-Bench提供严格的评估基准。所有资源已开源，为GPU代码可移植性开辟了新途径。

至顶网科技行者 2025-06-09 07:22:22

全面融入AI与可持续性能力，IBM重推解决云转型最后一公里业务难题的黑科技产品

IBM中国科技团队近日宣布在IBM混合云与AI解决方案的基础技术能力之上，重点推出帮助企业走好最后一公里、快速解决以上迫切业务难题的黑科技产品。

至顶网业界供稿 2022-12-19 10:58:06

中科大团队推出深度研究智能体新基准：机器也能像博士生一样写研究报告了？

中科大团队推出深度研究智能体评测基准DeepResearch Bench，包含100个跨22领域的博士级研究任务，创新性地设计了RACE和FACT双重评估框架，分别评判AI生成报告质量和信息收集能力。测试显示谷歌Gemini表现最佳，该研究为AI研究助手行业建立了首个科学统一的评估标准。

至顶网科技行者 2025-06-20 09:29:26

硬科技智能“四重奏”

——“第12届中国硬科技产业链创新趋势峰会”

至顶网毛烁 2024-10-28 18:27:17

对话谷歌出海创业加速器：打出“选赛道、找抓手和PMF”的组合拳

Polyverse联合创始人兼CGO邱子珺和大逐创新CEO林军峰，与谷歌出海创业加速器全球负责人Sami Kizilbash一起接受了科技行者的采访，探讨了中国企业出海的心得、谷歌出海创业加速器的赋能、不同国家创业者的特质等一系列话题。

至顶网科技行者 2023-09-18 19:15:09

分析1000篇论文后，牛津大学团队发现AI的思考过程不可信

至顶网至顶AI实验室 2025-07-11 18:13:20

混合线性注意力机制的系统性分析：当传统Transformer遇上创新"混血"架构——加州大学圣克鲁兹分校与字节跳动的突破性研究

这项研究通过训练72个不同配置的模型，系统分析了混合线性注意力架构的设计原则。研究发现独立表现最佳的线性注意力机制在混合架构中未必最优，并识别出选择性门控、分层递归和控制性遗忘是成功混合架构的三大关键要素。结果表明，采用3:1到6:1的线性与全注意力比例能够在保持性能的同时将内存使用量减少4-7倍。

至顶网科技行者 2025-07-18 09:37:33

从阿里辞职后不再内卷——一位德国程序员的“躺平”之路

如果你是因为幻想着新生活的美好而移民，那你将必然失望，因为生活中的盐总是咸的，哪里都一样。如果你是因为要逃离旧世界的痛苦而移民，那你几乎一定会幸福，因为那一时一地的苦难并不是普世价值。

至顶网尼酱 2022-06-16 16:27:56

大语言模型为什么总是"学会"错误的东西？浙江大学研究团队找到了让AI更聪明的全新方法

浙江大学研究团队开发了CAT方法，通过在大语言模型的注意力机制中注入因果知识，解决AI容易学习虚假关联而非真正因果关系的问题。实验显示该方法显著提升了模型在新环境下的表现，如Llama模型准确率从64.5%提升至90.5%。这项创新为开发更可靠、具备真正推理能力的AI系统提供了新思路。

至顶网科技行者 2025-09-26 12:21:19

“用智能，开启无限可能” 2024惠普商用AI战略暨AI PC新品发布会盛大举行，智领无界未来

“用智能，开启无限可能。”

至顶网业界供稿 2024-05-09 19:10:53

会议观察 | 2023全球人工智能开发者先锋大会精彩回顾

2023全球人工智能开发者先锋大会在上海临港成功举办。

至顶网孙硕宿硕 2023-03-01 18:30:25