搜一下
用了 0.103043秒,为您找到
澳洲
幸运
10
怎么
才能
網纸
YB233
相关内容8133 条
打造自主信息搜索智能体:阿里巴巴WebDancer的探索之路
阿里巴巴集团和同义实验室的研究团队推出了WebDancer,这是一种能够在网络上自主搜索信息并回答复杂问题的智能体系统。研究团队提出了一个四阶段构建框架,包括数据合成、轨迹采样、监督微调和强化学习。他们创新性地开发了CRAWLQA和E2HQA两种方法来生成高质量训练数据,并采用ReAct框架使智能体能够交替进行思考和行动。实验结果表明,WebDancer在GAIA和WebWalkerQA等基准测试中表现优异,甚至在某些情况下超越了GPT-4o,证明了该方法在构建自主信息搜索智能体方面的有效性。
至顶网
科技行者 2025-06-01 18:59:36
伦敦大学学院新突破:让AI神经网络"忠于本心",避免产生虚假特征
伦敦大学学院研究团队提出FaithfulSAE方法,通过让AI模型用自生成数据训练稀疏自编码器,解决传统方法中的"虚假特征"问题。实验证明该方法在多个模型上显著提高了特征提取的稳定性和可靠性,为AI可解释性研究提供了新思路。
至顶网
科技行者 2025-06-26 10:14:49
ByteDance突破性AI技术:DreamPoster让每个人都能设计出专业级海报
ByteDance智能创作实验室开发的DreamPoster系统,能够根据用户提供的图片和文字描述自动生成专业级海报设计。该系统通过创新的数据处理管道、渐进式训练策略和多模态架构,在用户满意度测试中达到88.55%的高分,远超GPT-4o等竞争系统,将很快在Jimeng等平台上线。
至顶网
科技行者 2025-07-22 10:19:12
ZeroGUI:零人工成本下自动化在线GUI学习的突破性研究
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。
至顶网
科技行者 2025-06-03 18:35:51
UNC Chapel Hill让AI变身万能专家:一个模型解决所有视觉推理难题
北卡罗来纳大学教堂山分校研究团队提出MEXA框架,通过动态选择和聚合多个专业AI模型来处理复杂的多模态推理任务。该方法无需额外训练,在视频理解、音频分析、3D场景理解和医学诊断等多个基准测试中显著超越现有模型,为AI系统设计提供了新思路。
至顶网
科技行者 2025-06-25 14:54:23
生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性
本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。
至顶网
Forbes 2025-01-03 15:17:09
AI代理的智慧升级:蚂蚁集团"原子搜索者"如何用细致思考引领深度研究新时代
蚂蚁集团研究团队提出了革命性的"原子思考"AI框架Atom-Searcher,通过将复杂推理分解为细粒度功能单元,配合精细化奖励机制,让AI学会像人类专家般深度思考。该系统在七项基准测试中均达到最优表现,不仅能进行更深入的多步推理,还展现出强大的跨领域适应能力,为AI在科研、商业、教育等专业领域的应用开辟了新前景。
至顶网
科技行者 2025-08-28 11:09:25
清华大学团队重新定义视频搜索:当几何学遇上人工智能,让机器像人类一样"理解"视频层次
清华大学团队在2025年发表突破性研究,首次将双曲几何学引入视频检索领域,解决了传统系统在处理"部分相关视频检索"时的层次理解问题。通过HLFormer框架的双空间并行处理和创新的部分序保持损失机制,在三个权威数据集上实现显著性能提升,为视频搜索技术开辟了全新发展方向。
至顶网
科技行者 2025-07-29 17:16:01
AI合作推理新突破:让多个AI像团队一样实时协作解决复杂问题
这项来自Yandex和多所国际院校的突破性研究首次实现了多个大语言模型的实时协作推理,让AI能像人类团队一样即时分享思考过程并自发分工合作。通过创新的共享注意力缓存技术,多个AI可以同时处理复杂问题,避免重复劳动,相互纠错验证,显著提升解题效率和准确率,为AI从单体智能向群体智能转变开辟了新路径。
至顶网
科技行者 2025-07-17 09:25:30
Adobe Research团队重新定义长视频生成:从5秒到5分钟的技术突破之路
Adobe Research联合32家顶尖机构发布重磅研究,全面解析长视频生成技术现状与突破路径。研究发现当前AI视频生成存在时长限制(多数仅5-16秒)和质量衰减问题,通过分析六大技术流派和核心架构组件,为实现电影级长视频生成提供了系统性解决方案,预示着从几秒短片向几分钟完整故事视频的技术跃迁即将到来。
至顶网
科技行者 2025-07-21 10:02:02
对话群核科技黄晓煌:用爆款孕育家居“独角兽”,用AIGC再改“游戏规则”
一个承载家居产业的数字化创新“飞轮”是如何诞生的。
至顶网
周雅 2023-10-17 10:18:30
对话群核科技黄晓煌:用爆款孕育家居“独角兽”,用AIGC再改“游戏规则”
一个承载家居产业的数字化创新“飞轮”是如何诞生的。
至顶网
周雅 2023-10-17 18:47:12
谷歌DeepMind团队揭秘:AI如何像人类一样掌握复杂推理技巧
谷歌DeepMind团队开发了过程监督强化学习技术,让AI学会像人类一样进行复杂推理。该方法不仅关注最终答案,更重视推理过程中每一步的合理性。在数学推理测试中,AI准确率从41%提升至73%。这项技术为AI在教育、科研、医疗等领域的应用开辟了新可能,让AI决策过程更加透明可信。
至顶网
科技行者 2025-08-29 09:33:48
复旦大学发布StrandDesigner:让画几笔线条就能生成逼真3D头发的人工智能系统
复旦大学和腾讯优图实验室联合推出StrandDesigner系统,首次实现通过手绘草图自动生成逼真3D头发的突破。该技术采用可学习多尺度放大策略和自适应条件控制机制,能处理从简单涂鸦到专业草图的各种输入,在多项指标上显著超越现有方法,有望革新游戏、影视等数字内容创作流程。
至顶网
科技行者 2025-08-12 14:16:02
微软等顶级科研机构联手发现:让AI说话像真人一样流畅,关键在于给声音加上"身体语言"
微软等机构联合开发的NaturalSpeech 3实现了革命性的语音合成突破,通过因子化编解码器和扩散模型技术,首次让AI能够生成具有真人般自然韵律和情感表达的语音。该系统具备零样本学习能力,仅需少量样本即可模仿任何人的声音特征,在主观评测中达到以假乱真的水平,为医疗康复、教育娱乐、个人助手等领域带来广阔应用前景。
至顶网
科技行者 2025-08-26 10:17:33
林乐和他的零数科技:构建数字经济的“通用”“信任”基础设施
区块链技术正在经历时间、市场和应用的大型洗礼,迷雾正在散去,变革正在发生,每个行业都将受到影响。
至顶网
周雅 2022-04-06 20:46:29
苹果团队突破性研究:让AI既能并行思考又能准确编程的神奇模型DiffuCoder
苹果公司联合香港大学开发了DiffuCoder,这是首个采用扩散模型的AI编程助手,能够像人类程序员一样进行全局思考和并行生成代码。该模型通过创新的"耦合GRPO"强化学习算法,在EvalPlus等权威测试中性能提升4.4%,并实现了更快的代码生成速度。这项研究为AI编程助手从线性生成向智能化并行思考的转变奠定了基础。
至顶网
科技行者 2025-07-03 13:59:53
“工业元宇宙”是进入元宇宙的正确方式之一
无论是什么新理念、新技术,只有创造价值,才有意义。
至顶网
高玉娴 2021-11-26 10:24:21
机器人学会看图推理:约翰霍普金斯与StepFun联合突破多模态AI的"思维障碍"
约翰霍普金斯大学与StepFun公司联合研究,成功让AI学会"边看边思考"的视觉推理能力。通过两阶段训练方法,先让AI在文字推理中掌握认知行为,再迁移到视觉任务中。开发的OVR模型在多项测试中创造新纪录,为AI教育助手、医疗诊断、科研分析等应用奠定基础。
至顶网
科技行者 2025-07-21 11:37:52
林乐和他的零数科技:构建数字经济的“通用”“信任”基础设施
区块链技术正在经历时间、市场和应用的大型洗礼,迷雾正在散去,变革正在发生,每个行业都将受到影响。
至顶网
周雅 2022-04-07 09:52:29
<
上一页
390
391
392
393
394
395
396
397
398
399
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号