搜一下
用了 0.033010秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容1940 条
希伯来大学首创:让AI学会"何时开口"的狼人杀实验
希伯来大学研究团队通过狼人杀游戏验证了AI在异步群体交流中的能力。他们开发的双阶段AI系统能够自主决定发言时机和内容,在21场真人游戏中表现出色。AI的发言时机与人类高度相似,超过40%的人类玩家无法识别AI身份,游戏胜率与人类相当。研究首次实现了AI在群体对话中的主动参与,为AI融入现实社交场景奠定了技术基础,在教育、医疗、客服等领域具有广阔应用前景。
至顶网
科技行者 2025-06-17 10:16:17
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
至顶网
科技行者 2025-06-11 07:48:46
IBM研究院突破性新工具:让AI自己找出"哪里做错了",告别人工排错时代
IBM研究院推出革命性AI诊断工具CLEAR,能够自动分析AI系统错误并生成详细报告。该工具采用"AI评判AI"的创新方法,将复杂的错误分析过程自动化,帮助开发者快速发现问题模式。用户研究显示75%的开发者认为该工具比传统手工分析更高效,已开源供全球开发者使用。
至顶网
科技行者 2025-08-04 10:00:12
Hugging Face团队推出SmolLM2:小而精的语言模型如何在大模型时代找到自己的位置
Hugging Face团队发布SmolLM2语言模型研究报告,详细阐述了17亿参数小型模型的创新训练方法。该研究通过多阶段精细化训练策略和三个全新数据集(FineMath、Stack-Edu、SmolTalk)的创建,证明了小模型在数据质量优化下可达到优异性能。模型在多项基准测试中超越同规模竞品,为人工智能技术的普及化和可持续发展提供了新的技术路径。
至顶网
科技行者 2025-08-26 12:03:38
对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!
为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
至顶网
周雅 2024-01-16 13:31:26
对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!
为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
至顶网
周雅 2024-01-16 11:50:17
《数字经济洞察周报》2023年第30期 | Google发布能力最强AI多模态大模型Gemini
Google发布能力最强AI多模态大模型Gemini;深圳发布算力基础设施支持政策;人工智能计算力报告发布。
至顶网
孙硕 2023-12-07 18:08:21
亚马逊Nova Premier能造出生化武器吗?三大风险领域全面安全评估揭秘
亚马逊发布Nova Premier AI模型的首个全面安全评估报告,针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法,并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升,但实际危险操作能力仍在安全阈值内,可安全向公众开放。
至顶网
科技行者 2025-07-18 09:35:33
OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界
GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。
至顶网
至顶AI实验室 2025-08-11 16:44:20
新加坡国立大学团队揭示:让AI既能看又能做的视觉强化学习新突破
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
至顶网
科技行者 2025-08-13 14:37:30
视频生成AI的"读心术":VBench-2.0如何测试AI是否真的理解我们的世界
这项由上海人工智能实验室等多家机构联合开展的研究,开发了VBench-2.0评估系统,专门测试视频生成AI对真实世界的理解能力。与关注视觉效果的传统评估不同,VBench-2.0从人体逼真度、可控性、创造力、物理学和常识推理五个维度,全面检验AI是否真正理解物理规律和逻辑关系,为视频生成技术发展提供了新的评估标准。
至顶网
科技行者 2025-07-30 09:58:27
明尼苏达大学突破性研究:AI评判系统学会自我反思,让机器像人类一样思考评价
明尼苏达大学团队开发的MPO系统让AI评判具备了类似人类的元认知能力,能够自我反思并动态调整评价标准。该系统有效解决了AI训练中的"奖励欺骗"问题,在文章写作、文档总结、道德推理和数学推理四个任务中都表现出显著优势,为构建更智能、更可靠的AI系统开辟了新路径。
至顶网
科技行者 2025-07-14 09:49:47
Skywork AI团队揭秘:如何让AI助手真正理解人类喜好?史上最大规模偏好数据集诞生记
Skywork AI团队通过创新的人机协作数据处理方法,构建了史上最大规模的高质量偏好数据集SynPref-40M,训练出Skywork-Reward-V2系列模型。该系列在七项主要测试中全面超越现有最佳模型,证明了数据质量胜过算法复杂度的重要原理,为AI更好理解人类偏好开辟了新道路。
至顶网
科技行者 2025-07-04 17:22:18
1997年,乔布斯在WWDC闭幕环节做了唯一一场即兴问答:我们要做“更好的产品”,而非“不同的产品”,十年后,iPhone发布
乔布斯在1997年WWDC的传奇问答中,直面批评、分享战略转型:聚焦意味着勇敢说"不",创新不是为不同而不同,而是做到"好得多很多",产品必须从用户体验倒推技术。这场对话奠定了苹果未来20年的成功基因。
至顶网
至顶AI实验室 2025-06-11 18:35:20
C2M,一场价值链的博弈,一场数字化的变革
C2M在逐渐全球化的世界中给了我们一个再次创造的机会,因为它带来的既是一场价值链的重新布局,也是一场产业数字化的变革。
至顶网
王聪彬 2021-02-18 09:38:20
软件
工程师的AI助手真能独当一面?Nebius AI 72B参数强化学习智能体破解代码修复难题
Nebius AI研究团队成功开发出基于强化学习的
软件
工程智能体,能够像经验丰富的程序员一样独立调试代码。该智能体基于Qwen2.5-72B模型训练,通过两阶段策略将SWE-bench Verified基准测试成功率从20%提升至39%,可处理长达13万令牌的复杂交互,在真实GitHub项目中进行多轮调试。研究证明开源模型通过精心设计的强化学习训练策略,无需依赖昂贵专有模型即可达到世界领先性能,为AI编程助手的实用化和普及奠定了重要技术基础。
至顶网
科技行者 2025-08-12 10:10:45
ChatGPT:我围观了量子位MEET2023智能未来大会,还当了一回课代表
我们为何想跟ChatGPT交谈?何为第五范式?近二十位行业领袖共话前沿科技未来。
至顶网
至顶网商用办公频道 2022-12-15 18:29:14
NIST负责任可信AI:对抗性机器学习攻击方式和缓解措施分类和术语
智能汽车的驾驶辅助系统可能被对手通过在道路上布置干扰误导,或在训练阶段加入有毒样本实现物理后门,导致汽车偏离路线。对抗性机器学习研究这种对手与模型间的对抗博弈。
至顶网
清华大学智能法治研究院 2024-02-29 16:25:10
《数字经济洞察周报》2024年第2期 |智谱AI技术开放日发布GLM-4大模型
智谱AI发布GLM-4大模型;工信部发布《国家人工智能产业综合标准化体系建设指南》(征求意见稿);高通骁龙数字底盘、联想AI PC亮相CES 2024
至顶网
孙硕 2024-01-18 16:29:19
这45个场景,正在被区块链抽筋扒皮…
在不少中国的投资人和合作伙伴们的眼中,这是个落地的好项目。其母公司AitherCO2,已经在欧洲和北美耕耘八年,通过节能改造,帮助2000个客户节省超过7亿美元的能源开支。
至顶网
业界供稿 2018-11-20 11:48:59
<
上一页
92
93
94
95
96
97
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号