搜一下
用了 0.137077秒,为您找到
澳洲
幸运
10
怎么
才能
網纸
YB233
相关内容14318 条
上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"
上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出惊人的跨学科推理能力,在物理、化学、生物等领域都有优异表现,性能接近OpenAI的o1模型。研究团队将所有成果完全开源,为AI研究社区提供了宝贵资源。
至顶网
科技行者 2025-08-01 10:15:26
南洋理工大学重磅突破:让AI同时"造梦"第一视角视频和人体动作
新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。
至顶网
科技行者 2025-08-29 14:08:39
音乐创作新革命:上海AI实验室让你只需输入歌词就能生成完整歌曲
上海AI实验室等机构联合开发的SongGen系统实现了AI音乐生成的重大突破,能够在单一阶段同时生成人声和伴奏,用户只需输入歌词和描述就能创作完整歌曲。该系统提供混合和双轨两种生成模式,支持语音克隆功能,在多项评估中超越传统多阶段方法。研究团队还构建了包含54万样本的开源数据集,并将完整代码和数据公开发布,为AI音乐创作的民主化奠定基础。
至顶网
科技行者 2025-10-10 10:30:23
阿里巴巴推出ThinkSound:让AI像音效师一样"思考"创造声音
阿里巴巴联合香港科技大学和浙江大学开发的ThinkSound系统,通过引入思维链推理让AI学会像专业音效师一样思考和创作。该系统采用三步式交互流程,支持基础音景生成、物体定制和语言编辑,在多项评测中表现优异,有望降低音效制作门槛并提升创作效率。
至顶网
科技行者 2025-07-02 11:24:54
网易有道团队发布Confucius3-Math:让消费级GPU也能跑出顶级数学推理能力的14B参数模型
网易有道研究团队开发了Confucius3-Math,这是一个专门针对中国K-12数学教育的14B参数AI模型。该模型在多项数学推理测试中表现出色,超越了许多规模更大的竞争对手,训练成本仅需2.6万美元,推理速度比DeepSeek-R1快15倍,能在消费级GPU上高效运行,旨在通过降低AI教育成本来促进教育公平。
至顶网
科技行者 2025-07-02 09:09:50
中科大联合百度开发的S2K框架:让大语言模型秒变专业领域问答专家
中科大和百度联合研究团队开发了S2K框架,这是一种创新的大语言模型专业领域适配技术。该框架通过智能的内外部知识融合机制和分阶段训练策略,仅用传统方法1%的训练数据就能让通用模型在医学、法律、金融等专业领域达到专家级问答水平,为人工智能在专业领域的高效应用提供了新的解决方案。
至顶网
科技行者 2025-09-03 12:28:18
清华大学重磅推出"城市大脑":首个懂看懂听懂路的AI,让机器像老司机一样理解城市
清华大学团队开发了首个能同时理解街景、卫星图、轨迹和地理数据的城市AI系统UrbanLLaVA。通过创新的三阶段训练法和多模态融合技术,该系统在十二项城市任务测试中显著超越现有方法,为智慧城市、导航服务、城市规划等领域带来突破性进展,代码已开源。
至顶网
科技行者 2025-07-02 11:37:16
中山大学团队打造"软件修复流水线":让AI自动解决编程难题
中山大学研究团队开发了SWE-Factory自动化系统,通过四个AI助手协作完成GitHub问题解决环境构建。系统利用程序退出码实现自动评分,解决了传统手工方法费时费力的问题。实验显示能以低成本自动构建数百个有效测试实例,为AI软件工程训练提供大规模高质量数据,有望推动编程AI工具的快速发展。
至顶网
科技行者 2025-06-17 13:12:53
香港大学与字节跳动联手打造的Goku:让AI同时掌握图片和视频生成的"变形金刚"
香港大学与字节跳动联合开发了名为Goku的AI模型,能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构,使用1.6亿张图片和3600万段视频训练,在多项评测中达到业界领先水平,在VBench视频测试中获得84.85分,GenEval图片测试中达到0.76分,展现了AI视觉生成技术向通用化发展的新趋势。
至顶网
科技行者 2025-08-25 14:27:23
南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像
南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式,让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次,从整体构图到精细细节逐步生成,不仅提高了图像质量,还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法,仅需9步即可生成高质量图像,为数字艺术创作和AI可控生成开辟了新路径。
至顶网
科技行者 2025-08-27 10:00:48
FlowReasoner:新加坡Sea AI Lab团队让AI智能体系统实现"一人一策"的突破性研究
这是由新加坡Sea AI Lab等机构联合完成的突破性研究,提出了FlowReasoner查询级元智能体系统。该系统能为每个用户查询定制专门的多智能体解决方案,突破了传统"一套方案解决一类问题"的局限。通过推理能力结合外部执行反馈的强化学习,在多个代码生成基准上综合准确率达81.89%,相比o1-mini提升
10
.52%,代表了AI系统从标准化向个性化发展的重要转折。
至顶网
科技行者 2025-07-15 10:02:07
全球首个开源音视频同步生成模型!StepFun团队让AI直接创造带声音的视频
由StepFun等机构开发的UniVerse-1是全球首个开源音视频同步生成模型,采用创新的"专家缝合"技术融合视频和音频生成专家,配合在线标注流水线解决数据对齐问题,在7600小时训练数据上实现了协调的音视频内容生成,为开源社区提供了完整的技术方案和评估基准。
至顶网
科技行者 2025-09-22 10:25:59
乔治亚理工学院开发AI聊天界面,让机器人明白你真正想要什么
乔治亚理工学院联合Adobe Research开发的OnGoal系统,通过智能目标追踪和可视化反馈,解决了用户与AI长对话时目标混乱、沟通低效的问题。20人实验证明,该系统让用户完成任务更快、压力更小,还能学会更有效的AI沟通策略,为未来人机协作指明了透明化、个性化的发展方向。
至顶网
科技行者 2025-09-04 14:31:26
天津大学发布重大突破:让机器人真正学会"用眼看,用手做"的神奇技术
天津大学研究团队开发出Embodied-R1智能机器人系统,通过创新的"指向"技术和强化学习训练,成功解决了机器人视觉理解与实际操作之间的鸿沟。该系统具备四种核心指向能力,在11项基准测试中表现卓越,在未见过的环境中实现56.2%仿真成功率和87.5%真实任务成功率,相比基线模型提升62%,展现出强大的零样本泛化能力和实用潜力。
至顶网
科技行者 2025-08-28 11:07:52
北卡罗来纳大学教堂山分校:AI智能体终于学会了"举一反三"——像人类一样从失败中提炼技能
北卡罗来纳大学教堂山分校等机构的研究团队开发出SKILLRL框架,让AI智能体首次具备了类似人类的经验学习能力。该系统能够从成功和失败的经验中提炼可复用技能,建立分层技能库,并在训练过程中实现自我进化。实验显示,SKILLRL在复杂任务中的成功率比传统方法提升超过15%,同时大幅减少了计算资源消耗,为构建更智能的AI系统开辟了新路径。
至顶网
科技行者 2026-02-11 15:54:48
任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话
任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话,认为还是要和大家勇敢地沟通,一起前进,战胜困难,我们要敢于走在时代前沿。
至顶网
至顶网数字化转型频道 2021-09-14 22:08:40
韩国成均馆大学让AI"忘掉"敏感数据的可视化新工具:机器遗忘技术的透明评估系统
韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator,解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法,并基于分析洞察开发出性能优异的引导遗忘新方法,为构建更负责任的AI系统提供重要工具支持。
至顶网
科技行者 2025-09-09 10:56:07
AI人体运动生成技术新突破:
澳洲
国立大学团队让机器从零开始学会"随音起舞"与"看文生动"
澳洲
国立大学团队开发的Motion Anything系统实现了AI动作生成的重大突破,能够根据文字、音乐或两者组合自动生成逼真的人体动作。该系统采用创新的注意力引导遮罩策略和双重变换器架构,在多个基准测试中显著超越现有方法,并创建了包含2153组数据的TMD数据集。这项技术为影视制作、游戏开发和虚拟现实等领域带来新的可能性。
至顶网
科技行者 2025-07-30 09:50:54
约翰霍普金斯大学推出DOTRESIZE:神奇的AI模型"瘦身术"让大模型既快又好用
约翰霍普金斯大学发布DOTRESIZE技术,通过最优传输理论实现AI大模型智能压缩。该方法将相似神经元合并而非删除,在保持性能的同时显著降低计算成本。实验显示,压缩20%后模型仍保持98%性能,为AI技术普及和可持续发展提供新路径。
至顶网
科技行者 2025-07-21 14:37:33
机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
至顶网
科技行者 2025-08-14 10:29:17
<
上一页
709
710
711
712
713
714
715
716
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号