搜索准确率最高的计划软件【罔芷:——88pk·ee—

希伯来大学首创：让AI学会"何时开口"的狼人杀实验

希伯来大学研究团队通过狼人杀游戏验证了AI在异步群体交流中的能力。他们开发的双阶段AI系统能够自主决定发言时机和内容，在21场真人游戏中表现出色。AI的发言时机与人类高度相似，超过40%的人类玩家无法识别AI身份，游戏胜率与人类相当。研究首次实现了AI在群体对话中的主动参与，为AI融入现实社交场景奠定了技术基础，在教育、医疗、客服等领域具有广阔应用前景。

至顶网科技行者 2025-06-17 10:16:17

FusionAudio-1.2M：当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集，创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法，构建了包含120万高质量音频描述的大规模数据集。实验表明，使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法，为智能语音助手、自动驾驶等领域带来重要应用前景。

至顶网科技行者 2025-06-11 07:48:46

IBM研究院突破性新工具：让AI自己找出"哪里做错了"，告别人工排错时代

IBM研究院推出革命性AI诊断工具CLEAR，能够自动分析AI系统错误并生成详细报告。该工具采用"AI评判AI"的创新方法，将复杂的错误分析过程自动化，帮助开发者快速发现问题模式。用户研究显示75%的开发者认为该工具比传统手工分析更高效，已开源供全球开发者使用。

至顶网科技行者 2025-08-04 10:00:12

Hugging Face团队推出SmolLM2：小而精的语言模型如何在大模型时代找到自己的位置

Hugging Face团队发布SmolLM2语言模型研究报告，详细阐述了17亿参数小型模型的创新训练方法。该研究通过多阶段精细化训练策略和三个全新数据集(FineMath、Stack-Edu、SmolTalk)的创建，证明了小模型在数据质量优化下可达到优异性能。模型在多项基准测试中超越同规模竞品，为人工智能技术的普及化和可持续发展提供了新的技术路径。

至顶网科技行者 2025-08-26 12:03:38

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

为什么选择做AI Agent？澜码科技创始人兼CEO周健的解释是：传统的系统是人适应机器，造成人成为数据的搬运工；今天有了大模型，我们有机会让机器去适应人，在这方面AI Agent前景广阔。

至顶网周雅 2024-01-16 13:31:26

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

为什么选择做AI Agent？澜码科技创始人兼CEO周健的解释是：传统的系统是人适应机器，造成人成为数据的搬运工；今天有了大模型，我们有机会让机器去适应人，在这方面AI Agent前景广阔。

至顶网周雅 2024-01-16 11:50:17

《数字经济洞察周报》2023年第30期 | Google发布能力最强AI多模态大模型Gemini

Google发布能力最强AI多模态大模型Gemini；深圳发布算力基础设施支持政策；人工智能计算力报告发布。

至顶网孙硕 2023-12-07 18:08:21

亚马逊Nova Premier能造出生化武器吗？三大风险领域全面安全评估揭秘

亚马逊发布Nova Premier AI模型的首个全面安全评估报告，针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法，并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升，但实际危险操作能力仍在安全阈值内，可安全向公众开放。

至顶网科技行者 2025-07-18 09:35:33

OpenAI GPT-5突破性安全架构：当AI学会"思考"后如何确保不越界

GPT-5是OpenAI于2025年8月发布的新一代多模式大模型，兼具高效应答与深度推理能力，并在安全性、准确性和多语言表现上取得显著提升，尤其在医疗、内容安全与防越狱方面展现突破性进步。

至顶网至顶AI实验室 2025-08-11 16:44:20

新加坡国立大学团队揭示：让AI既能看又能做的视觉强化学习新突破

新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展，涵盖超过200项代表性工作。研究将该领域归纳为四大方向：多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型，分析了从RLHF到可验证奖励范式的政策优化策略演进，并识别出样本效率、泛化能力和安全部署等关键挑战，为这一快速发展的交叉学科提供了完整的技术地图。

至顶网科技行者 2025-08-13 14:37:30

视频生成AI的"读心术"：VBench-2.0如何测试AI是否真的理解我们的世界

这项由上海人工智能实验室等多家机构联合开展的研究，开发了VBench-2.0评估系统，专门测试视频生成AI对真实世界的理解能力。与关注视觉效果的传统评估不同，VBench-2.0从人体逼真度、可控性、创造力、物理学和常识推理五个维度，全面检验AI是否真正理解物理规律和逻辑关系，为视频生成技术发展提供了新的评估标准。

至顶网科技行者 2025-07-30 09:58:27

明尼苏达大学突破性研究：AI评判系统学会自我反思，让机器像人类一样思考评价

明尼苏达大学团队开发的MPO系统让AI评判具备了类似人类的元认知能力，能够自我反思并动态调整评价标准。该系统有效解决了AI训练中的"奖励欺骗"问题，在文章写作、文档总结、道德推理和数学推理四个任务中都表现出显著优势，为构建更智能、更可靠的AI系统开辟了新路径。

至顶网科技行者 2025-07-14 09:49:47

Skywork AI团队揭秘：如何让AI助手真正理解人类喜好？史上最大规模偏好数据集诞生记

Skywork AI团队通过创新的人机协作数据处理方法，构建了史上最大规模的高质量偏好数据集SynPref-40M，训练出Skywork-Reward-V2系列模型。该系列在七项主要测试中全面超越现有最佳模型，证明了数据质量胜过算法复杂度的重要原理，为AI更好理解人类偏好开辟了新道路。

至顶网科技行者 2025-07-04 17:22:18

1997年，乔布斯在WWDC闭幕环节做了唯一一场即兴问答：我们要做“更好的产品”，而非“不同的产品”，十年后，iPhone发布

乔布斯在1997年WWDC的传奇问答中，直面批评、分享战略转型：聚焦意味着勇敢说"不"，创新不是为不同而不同，而是做到"好得多很多"，产品必须从用户体验倒推技术。这场对话奠定了苹果未来20年的成功基因。

至顶网至顶AI实验室 2025-06-11 18:35:20

C2M，一场价值链的博弈，一场数字化的变革

C2M在逐渐全球化的世界中给了我们一个再次创造的机会，因为它带来的既是一场价值链的重新布局，也是一场产业数字化的变革。

至顶网王聪彬 2021-02-18 09:38:20

软件工程师的AI助手真能独当一面？Nebius AI 72B参数强化学习智能体破解代码修复难题

Nebius AI研究团队成功开发出基于强化学习的软件工程智能体，能够像经验丰富的程序员一样独立调试代码。该智能体基于Qwen2.5-72B模型训练，通过两阶段策略将SWE-bench Verified基准测试成功率从20%提升至39%，可处理长达13万令牌的复杂交互，在真实GitHub项目中进行多轮调试。研究证明开源模型通过精心设计的强化学习训练策略，无需依赖昂贵专有模型即可达到世界领先性能，为AI编程助手的实用化和普及奠定了重要技术基础。

至顶网科技行者 2025-08-12 10:10:45

ChatGPT：我围观了量子位MEET2023智能未来大会，还当了一回课代表

我们为何想跟ChatGPT交谈？何为第五范式？近二十位行业领袖共话前沿科技未来。

至顶网至顶网商用办公频道 2022-12-15 18:29:14

NIST负责任可信AI：对抗性机器学习攻击方式和缓解措施分类和术语

智能汽车的驾驶辅助系统可能被对手通过在道路上布置干扰误导，或在训练阶段加入有毒样本实现物理后门，导致汽车偏离路线。对抗性机器学习研究这种对手与模型间的对抗博弈。

至顶网清华大学智能法治研究院 2024-02-29 16:25:10

《数字经济洞察周报》2024年第2期 |智谱AI技术开放日发布GLM-4大模型

智谱AI发布GLM-4大模型；工信部发布《国家人工智能产业综合标准化体系建设指南》（征求意见稿）；高通骁龙数字底盘、联想AI PC亮相CES 2024

至顶网孙硕 2024-01-18 16:29:19

这45个场景，正在被区块链抽筋扒皮…

在不少中国的投资人和合作伙伴们的眼中，这是个落地的好项目。其母公司AitherCO2，已经在欧洲和北美耕耘八年，通过节能改造，帮助2000个客户节省超过7亿美元的能源开支。

至顶网业界供稿 2018-11-20 11:48:59