用了 0.134447秒,为您找到bob 手机 在线 網纸 YB233相关内容9432 条
  • 清华大学团队发布URSA:首个多模态数学推理过程奖励模型,让AI数学推理像人一样可验证

    清华大学团队发布URSA系统,这是首个针对多模态数学推理的过程奖励模型。该系统通过创新的三阶段训练框架,不仅能解决复杂的图文结合数学问题,更重要的是能提供完全可验证的推理过程。URSA在六个标准测试中全面超越同规模开源模型,甚至在平均性能上超过GPT-4o达2.7个百分点,代表了AI推理可解释性的重要突破。
    至顶网  科技行者  2025-09-17 13:28:00  
  • 浙大阿里联合发布:用2.5年教学视频训练AI,教出来的模型做数学题比传统方法厉害太多!

    浙江大学与阿里巴巴合作,创新性地使用2.2万小时教学视频训练AI模型,创建了首个大规模视频基础的多模态教科书。该方法让AI像真实学生一样从结构化教学内容中学习,在数学推理和科学问答等任务上性能大幅提升,证明了高质量教育数据比海量低质量数据更有价值,为AI教育应用开辟了新路径。
    至顶网  科技行者  2025-09-19 10:03:20  
  • 蚂蚁集团包容性AI团队重磅发布Ming-Omni:首个媲美GPT-4o的开源全能AI模型

    这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni,这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频,并具备语音和图像生成能力。采用MoE架构和模态特定路由器,仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录,特别是在语音理解、图像生成和多模态融合方面表现突出。
    至顶网  科技行者  2025-06-18 09:23:26  
  • 研究报告:AIGC人工智能生产内容行业趋势分析

    2022年下半年开始,“AIGC”接棒“元宇宙”成为全球关注的焦点和热议话题,各行各业都在积极探寻相关领域在AIGC助力下的崭新发展方向。
    至顶网  至顶网计算频道  2022-11-29 16:20:33  
  • 颜值和性能都在线的戴尔Precision 5770移动工作站

    有幸在第一时间拿到今年新发布的戴尔Precision 5770移动工作站,戴尔Precision 5770移动工作站是由戴尔Precision 5760移动工作站升级而来。戴尔Precision 5770移动工作站升级了哪些配置呢?
    至顶网  戴尔  2022-08-31 17:48:00  
  • Gradient团队突破分布式训练瓶颈:ECHO-2让AI训练成本骤降35%!

    Gradient公司联合多所知名学府开发的ECHO-2框架通过分布式架构突破了传统AI训练的成本瓶颈。该系统巧妙地将训练过程分解为三个独立车间,让便宜设备承担数据生成任务,昂贵设备专注核心学习,并允许适度的数据延迟来换取更高的资源利用效率。实验证明在保持模型质量的同时成功降低训练成本35%以上,为AI技术普及奠定了重要基础。
    至顶网  科技行者  2026-02-13 08:32:06  
  • 观远数据发布一站式BI 6.0:融合大语言模型,赋能数据驱动的敏捷经营

    2023年,在复杂严峻的外部环境影响下,商业环境愈发多变难测,市场进入周期更替的“蕴新”时刻,对企业应对内外变化的能力提出更高要求。
    至顶网  业界供稿  2023-10-23 17:04:57  
  • 中科院团队重磅发布:如何让AI在万千工具中精准定位?LiveMCPBench带你探索智能体的终极挑战

    中科院软件所团队发布LiveMCPBench,这是全球首个大规模MCP工具使用评估框架。该研究构建了包含527个工具的测试环境和95个真实任务,评估AI在复杂工具环境中的表现。测试显示Claude-Sonnet-4达到78.95%成功率,而多数模型仅30%-50%,揭示了AI工具组合使用能力的巨大差距,为未来智能助手发展指明方向。
    至顶网  科技行者  2025-08-08 09:57:37  
  • 当语音遇上表情:首个能同时生成说话和表情的AI模型问世

    韩国研究团队开发出全球首个能够同时生成语音和面部表情的AI系统JAM-Flow,突破了传统技术分离处理音频和视觉的局限。该系统采用多模态扩散变换器架构,通过联合注意力机制实现音频与表情的完美协调。在多项测试中表现优异,用户体验测试显示其生成效果明显优于现有系统。这项技术为虚拟主播、影视制作、教育培训等领域带来革命性进展,代表了多模态AI发展的重要里程碑。
    至顶网  科技行者  2025-07-04 10:19:59  
  • 达姆施塔特工业大学重磅发现:AI编程助手如何在不知不觉中变得更安全

    达姆施塔特工业大学研究团队开发的GoodVibe框架,通过精确识别AI模型中的"安全神经元"并进行针对性训练,让AI编程助手能在无明确安全要求下自动生成更安全的代码。该方法仅需训练模型0.03%的参数,就将安全代码生成率提升2.5倍,同时降低70%训练成本,为AI辅助编程的安全问题提供了创新解决方案。
    至顶网  科技行者  2026-02-13 08:33:02  
  • 新加坡团队突破!一张照片秒变4D世界:让静态画面"活"起来的黑科技

    新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息,构建了包含920万帧数据的4DNeX-10M大规模数据集,通过改进视频扩散模型实现15分钟内的高效生成,在动态程度和一致性指标上显著优于现有方法,为虚拟现实、影视制作等领域提供了新的技术路径。
    至顶网  科技行者  2025-08-26 14:18:34  
  • 机器人终于学会"预测未来":上海AI实验室开发出能看到下一秒的智能机器人大脑

    上海AI实验室开发的F1机器人"大脑"实现了革命性突破,让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作,F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中,F1的成功率大幅超越传统方法,特别是在动态环境和长期规划任务中表现卓越,为机器人智能化发展开辟了新道路。
    至顶网  科技行者  2025-09-23 10:01:56  
  • 百度2025 Q1财报深度解读:智能云表现强劲,萝卜快跑已拓展全球 李彦宏详解AI战略:AI-first战略使百度保持领先地位

    北京时间5月21日,百度发布2025年第一季度财报,并召开了投资者电话会议,百度Q1总营收达325亿元,百度核心营收255亿元,同比增长7%。但真正引人注目的是百度智能云同比增长42%的强劲表现,以及归属百度核心净利润76.33亿元,同比增长48%的亮眼成绩。这些数字背后,折射出百度AI-first战略的初步成效。李彦宏在会上明确表示:"我们相信,AI-first战略使我们能保持领先地位,在AI时代抓住长期增长机会。"这不仅是对过去一年战略执行的总结,更是对未来发展方向的坚定表态。
    至顶网  高书葆  2025-05-30 15:47:58  
  • AI视觉推理新突破:中国团队让机器像人一样"慢思考",仅用5千个文本案例就追平顶级商业系统

    这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。
    至顶网  科技行者  2025-09-15 11:06:51  
  • 亚马逊研究团队推出BeepBank-500:让电子音效研究变得像搭积木一样简单

    亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集,包含300-500个参数化合成电子音效,专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试,音频采用CC0-1.0许可证完全开放,填补了电子音效研究领域缺乏标准化工具的空白,为心理声学和人机交互研究提供了便捷的实验材料。
    至顶网  科技行者  2025-10-13 09:02:05  
  • zELO训练法:让AI排序更懂人心的新方法

    ZeroEntropy团队提出zELO训练方法,借鉴象棋ELO评分系统,通过AI模型两两比较文档相关性来训练重排序器。该方法避免了传统人工标注的高成本问题,训练出的zerank模型在多个领域测试中显著超越商业竞争对手,同时开源了模型权重和训练工具,为AI搜索技术发展提供了新的训练范式。
    至顶网  科技行者  2025-09-29 14:28:46  
  • 多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手

    清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能提升,特别是在高分辨率图像处理和复杂推理任务中表现突出,代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。
    至顶网  科技行者  2025-08-19 12:35:48  
  • ByteDance的双模型机器人导航系统:让移动机器人像人一样聪明地到处走动

    ByteDance Seed团队开发了名为Astra的革命性双模型机器人导航系统,让机器人具备类似人类的环境理解和导航能力。该系统包含Astra-Global和Astra-Local两个模块,前者负责理解自然语言指令和全局定位,后者处理局部路径规划和避障。通过创新的混合拓扑-语义地图、4D时空编码器和掩码ESDF损失等技术,系统在仓库、办公楼等复杂环境中实现了84%-99%的高成功率,显著超越传统方法,为智能机器人助手的实现奠定了重要基础。
    至顶网  科技行者  2025-06-13 08:04:11  
  • KAIST团队突破性视频检索技术:让AI在视频海洋中精准找到你想要的答案

    KAIST研究团队开发的VideoRAG系统实现了人工智能在视频内容理解上的重大突破。该系统能够直接从海量视频中检索相关内容并生成准确答案,解决了传统方法只能处理文字和图片信息的局限。通过智能帧选择和多模态信息融合技术,VideoRAG在问答准确性上显著超越现有方法,为教育培训、技能学习等领域提供了全新的智能问答解决方案。
    至顶网  科技行者  2025-09-18 11:06:33  
  • 代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

    威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。
    至顶网  科技行者  2025-06-19 17:00:12  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号