搜一下
用了 0.058759秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3162 条
上海多家顶尖学府首创同步视频音频生成技术:让AI同时"看见"和"听见"
这项由上海创新研究院、复旦大学、上海交通大学等机构联合完成的研究,首次实现了真正意义上的视频音频同步生成。MOVA系统拥有320亿参数,能够同时生成高质量的视频画面和完全匹配的音频内容,在唇音同步、多人对话、环境音效等方面都达到了行业领先水平,为AI内容创作开辟了全新的技术路径。
至顶网
科技行者 2026-02-10 15:36:11
让视频大模型更聪明:哈工大团队开发的VerIPO让模型推理更深更长
哈工大(深圳)团队提出VerIPO方法,通过验证器引导的迭代策略优化提升视频大语言模型的长推理能力。该方法创新性地在GRPO和DPO训练阶段之间引入验证器,筛选高质量推理样本,有效解决了传统强化学习方法在推理链质量和上下文一致性方面的不足。实验表明,VerIPO训练的7B参数模型超越了包括Kimi-VL(16B)和Video-R1在内的更大模型,在VSI-Bench等基准测试中取得41.8%的准确率,同时生成更长、更一致的推理链,为视频大模型的深度推理能力培养提供了高效可行的新方法。
至顶网
科技行者 2025-05-31 11:41:26
很遗憾,自然语言理解是AI尚未攻克的领域
事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。
至顶网
科技行者 2021-01-19 15:58:08
CES 2024 | 除了生成式AI,CES 2024还有这些值得关注的好产品
除了AI、汽车、手机壳外,今年的CES还有不少值得留意的新点子。
至顶网
刘文轩 2024-01-15 12:44:48
音乐AI的大考验:伦敦玛丽女王大学开发全新评测体系,揭示当前音乐智能模型的真实水平
伦敦玛丽女王大学研究团队开发了CMI-Bench音乐AI评测基准,首次对11个主流音乐AI模型进行全面测试。结果显示这些模型在标准化评测中表现远低于预期,普遍不如传统专业软件,还存在明显文化偏见和性别偏见,为音乐AI发展提供了重要警示。
至顶网
科技行者 2025-06-24 13:48:51
阿里巴巴推出LHM:让单张照片瞬间变身可动3D人物的神奇技术
阿里巴巴通义实验室开发的LHM系统能够在几秒钟内将单张人物照片转换成可自由运动的3D虚拟人物。该技术采用多模态变换器架构,结合3D高斯分布表示和自监督学习策略,在重建质量和生成速度上都显著优于现有方法,为虚拟现实、游戏制作和数字内容创作提供了新的可能性。
至顶网
科技行者 2025-07-30 09:49:08
仅需312个电脑操作轨迹,GAIR团队打造超高效电脑操作AI助手:数据质量胜过数据量
上海交通大学与GAIR实验室研究团队开发了PC Agent-E,一种高效的计算机操作AI代理训练框架。通过仅使用312个人类操作轨迹并利用Claude 3.7 Sonnet进行数据增强,该模型在WindowsAgentArena-V2基准测试上取得了36.0%的成功率,超越了同样强大的Claude 3.7 Sonnet(35.4%)。研究证明高质量数据比大量数据更重要,PC Agent-E通过改进长期规划能力实现了突破性进展,同时展示了跨平台泛化能力。所有代码、数据和模型已开源,为计算机操作AI代理研究提供了宝贵资源。
至顶网
科技行者 2025-05-27 15:30:12
Microsoft和Georgia Tech联手打造AI"瘦身教练":让超大AI模型也能在普通电脑上跑起来
Microsoft和Georgia Tech研究团队开发了SlimMoE技术,能将超大AI模型压缩到原来的10-20%
大小
而性能基本不变。该技术采用多阶段渐进式压缩,保留所有专家模块但精简内部结构,成功将419亿参数的模型压缩为76亿和38亿参数版本,让原本需要企业级硬件的AI能力可在普通电脑上运行,大大降低了AI技术使用门槛。
至顶网
科技行者 2025-06-26 10:15:55
港大团队让机器人学会了"看视频学人样":用VR眼镜就能训练人形机器人走路干活
香港大学等机构联合发布EgoHumanoid系统,首次实现用VR眼镜记录人类日常活动来训练人形机器人。该系统通过视角和动作对齐技术,让机器人学会在多样化环境中执行复杂任务,在陌生环境中的成功率比传统方法提升51%,为机器人训练开辟了全新路径。
至顶网
科技行者 2026-02-14 10:30:46
经济学家式思维:在经济问题上进行后训练,让大语言模型产生战略性泛化能力
这项研究展示了如何通过在经济问题上进行后训练,让大语言模型像经济学家一样思考,从而实现战略性泛化能力。研究团队开发了名为Recon的7B参数开源模型,通过在2,100个高质量经济推理问题上进行监督微调和强化学习,不仅提升了模型在经济基准测试上的表现,更重要的是让模型在从未直接训练过的多智能体博弈中展现出合理的战略行为。结果表明,领域对齐的后训练可以作为智能体对齐的可扩展路径,通过结构化推理问题培养出更广泛适用的理性决策能力。
至顶网
科技行者 2025-06-05 13:34:06
AI 大模型催生的新职业,提示词工程师是什么?
全方位解析“提示词工程师”。
至顶网
吴彤 2024-07-23 15:54:21
南京大学团队突破AI绘画速度瓶颈:让复杂算法学会"简化思考"
南京大学与阿里巴巴团队提出TeEFusion方法,通过文本嵌入融合技术解决AI图像生成中分类器自由引导的计算效率问题。该方法将传统需要双重推理的过程简化为单次计算,在保持图像质量的同时实现6倍推理加速,并在多个基准测试中超越现有蒸馏方法。
至顶网
科技行者 2025-07-29 09:34:26
JetBrains范圣佑:技术布道师的五个秘密武器
尽管有许多来自硅谷科技巨头的布道师被国内开发者们所熟知,并奉为大神,但技术布道师在国内尚属于新兴职业,多数人或许并不了解,这样一个自带光环的职业,究竟做些什么?又是怎样布道的?
至顶网
业界供稿 2021-08-16 17:13:25
ZeroGUI:零人工成本下自动化在线GUI学习的突破性研究
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。
至顶网
科技行者 2025-06-03 18:35:51
新思科技解读金融服务业的应用安全误区与现实
尽管如此,因为金融服务行业的性质,许多人认为这个行业应该非常安全。以下是新思科技(Synopsys)使用2020年度“软件安全构建成熟度模型”(BSIMM)报告中的研究数据来揭示并解释金融服务行业安全的七大误区。
至顶网
业界供稿 2021-07-30 17:15:13
大语言模型的"外挂"时代:Meta等机构揭秘为什么AI要学会借助工具而非死记硬背
Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。
至顶网
科技行者 2025-09-04 10:02:41
浙江大学团队发布OS Agents全景调研:让AI助手像钢铁侠贾维斯一样操控电脑手机
这项由浙江大学等多家机构联合完成的大规模调研首次系统性梳理了操作系统智能体这一前沿领域,全面分析了基于多模态大语言模型的AI助手如何像人类一样操作电脑手机。研究涵盖了技术架构、训练方法、评估体系和发展挑战,为实现类似贾维斯的智能数字助手提供了完整的技术路线图。
至顶网
科技行者 2025-08-13 14:35:46
MAXHUB智能会议解决方案首发,创新变革企业会议全流程
2019年,资本寒冬、经济萧条为企业敲响创新变革的警钟,除裁员外企业还有哪些自救、自强的方式?4月16日,MAXHUB率先行业发布智能会议解决方案,以企业会议为突破点让企业的“心脏”部位动起来,输送更多新鲜“血液”到各个部门,借此激活和延续企业生命力。
至顶网
科技行者 2019-04-16 21:28:57
钉钉7.0升级云Office产品,文档、会议、项目新增13项新功能
目前上海三菱电梯、海亮教育、菜鸟等企业已通过钉闪会实现了高效会议的治理。
至顶网
业界供稿 2022-12-28 18:41:55
71岁鲍勃·艾格的重返,能解救迪士尼危机吗?
鲍勃·艾格 (Robert A. "Bob" Iger) 将重返迪士尼担任CEO职务,重新掌管这家处于水深火热之中的文娱巨头。
至顶网
海外来电 2022-12-01 20:12:18
<
上一页
82
83
84
85
86
87
88
89
90
91
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号