搜索 bob手机在线【網纸——YB233典CN—

清华大学团队发布URSA：首个多模态数学推理过程奖励模型，让AI数学推理像人一样可验证

清华大学团队发布URSA系统，这是首个针对多模态数学推理的过程奖励模型。该系统通过创新的三阶段训练框架，不仅能解决复杂的图文结合数学问题，更重要的是能提供完全可验证的推理过程。URSA在六个标准测试中全面超越同规模开源模型，甚至在平均性能上超过GPT-4o达2.7个百分点，代表了AI推理可解释性的重要突破。

至顶网科技行者 2025-09-17 13:28:00

浙大阿里联合发布：用2.5年教学视频训练AI，教出来的模型做数学题比传统方法厉害太多！

浙江大学与阿里巴巴合作，创新性地使用2.2万小时教学视频训练AI模型，创建了首个大规模视频基础的多模态教科书。该方法让AI像真实学生一样从结构化教学内容中学习，在数学推理和科学问答等任务上性能大幅提升，证明了高质量教育数据比海量低质量数据更有价值，为AI教育应用开辟了新路径。

至顶网科技行者 2025-09-19 10:03:20

蚂蚁集团包容性AI团队重磅发布Ming-Omni：首个媲美GPT-4o的开源全能AI模型

这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni，这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频，并具备语音和图像生成能力。采用MoE架构和模态特定路由器，仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录，特别是在语音理解、图像生成和多模态融合方面表现突出。

至顶网科技行者 2025-06-18 09:23:26

研究报告：AIGC人工智能生产内容行业趋势分析

2022年下半年开始，“AIGC”接棒“元宇宙”成为全球关注的焦点和热议话题，各行各业都在积极探寻相关领域在AIGC助力下的崭新发展方向。

至顶网至顶网计算频道 2022-11-29 16:20:33

颜值和性能都在线的戴尔Precision 5770移动工作站

有幸在第一时间拿到今年新发布的戴尔Precision 5770移动工作站，戴尔Precision 5770移动工作站是由戴尔Precision 5760移动工作站升级而来。戴尔Precision 5770移动工作站升级了哪些配置呢？

至顶网戴尔 2022-08-31 17:48:00

Gradient团队突破分布式训练瓶颈：ECHO-2让AI训练成本骤降35%！

Gradient公司联合多所知名学府开发的ECHO-2框架通过分布式架构突破了传统AI训练的成本瓶颈。该系统巧妙地将训练过程分解为三个独立车间，让便宜设备承担数据生成任务，昂贵设备专注核心学习，并允许适度的数据延迟来换取更高的资源利用效率。实验证明在保持模型质量的同时成功降低训练成本35%以上，为AI技术普及奠定了重要基础。

至顶网科技行者 2026-02-13 08:32:06

观远数据发布一站式BI 6.0：融合大语言模型，赋能数据驱动的敏捷经营

2023年，在复杂严峻的外部环境影响下，商业环境愈发多变难测，市场进入周期更替的“蕴新”时刻，对企业应对内外变化的能力提出更高要求。

至顶网业界供稿 2023-10-23 17:04:57

中科院团队重磅发布：如何让AI在万千工具中精准定位？LiveMCPBench带你探索智能体的终极挑战

中科院软件所团队发布LiveMCPBench，这是全球首个大规模MCP工具使用评估框架。该研究构建了包含527个工具的测试环境和95个真实任务，评估AI在复杂工具环境中的表现。测试显示Claude-Sonnet-4达到78.95%成功率，而多数模型仅30%-50%，揭示了AI工具组合使用能力的巨大差距，为未来智能助手发展指明方向。

至顶网科技行者 2025-08-08 09:57:37

当语音遇上表情：首个能同时生成说话和表情的AI模型问世

韩国研究团队开发出全球首个能够同时生成语音和面部表情的AI系统JAM-Flow，突破了传统技术分离处理音频和视觉的局限。该系统采用多模态扩散变换器架构，通过联合注意力机制实现音频与表情的完美协调。在多项测试中表现优异，用户体验测试显示其生成效果明显优于现有系统。这项技术为虚拟主播、影视制作、教育培训等领域带来革命性进展，代表了多模态AI发展的重要里程碑。

至顶网科技行者 2025-07-04 10:19:59

达姆施塔特工业大学重磅发现：AI编程助手如何在不知不觉中变得更安全

达姆施塔特工业大学研究团队开发的GoodVibe框架，通过精确识别AI模型中的"安全神经元"并进行针对性训练，让AI编程助手能在无明确安全要求下自动生成更安全的代码。该方法仅需训练模型0.03%的参数，就将安全代码生成率提升2.5倍，同时降低70%训练成本，为AI辅助编程的安全问题提供了创新解决方案。

至顶网科技行者 2026-02-13 08:33:02

新加坡团队突破！一张照片秒变4D世界：让静态画面"活"起来的黑科技

新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息，构建了包含920万帧数据的4DNeX-10M大规模数据集，通过改进视频扩散模型实现15分钟内的高效生成，在动态程度和一致性指标上显著优于现有方法，为虚拟现实、影视制作等领域提供了新的技术路径。

至顶网科技行者 2025-08-26 14:18:34

机器人终于学会"预测未来"：上海AI实验室开发出能看到下一秒的智能机器人大脑

上海AI实验室开发的F1机器人"大脑"实现了革命性突破，让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作，F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中，F1的成功率大幅超越传统方法，特别是在动态环境和长期规划任务中表现卓越，为机器人智能化发展开辟了新道路。

至顶网科技行者 2025-09-23 10:01:56

百度2025 Q1财报深度解读：智能云表现强劲，萝卜快跑已拓展全球李彦宏详解AI战略：AI-first战略使百度保持领先地位

北京时间5月21日，百度发布2025年第一季度财报，并召开了投资者电话会议，百度Q1总营收达325亿元，百度核心营收255亿元，同比增长7%。但真正引人注目的是百度智能云同比增长42%的强劲表现，以及归属百度核心净利润76.33亿元，同比增长48%的亮眼成绩。这些数字背后，折射出百度AI-first战略的初步成效。李彦宏在会上明确表示："我们相信，AI-first战略使我们能保持领先地位，在AI时代抓住长期增长机会。"这不仅是对过去一年战略执行的总结，更是对未来发展方向的坚定表态。

至顶网高书葆 2025-05-30 15:47:58

AI视觉推理新突破：中国团队让机器像人一样"慢思考"，仅用5千个文本案例就追平顶级商业系统

这项由中国人民大学等机构合作完成的研究提出了Virgo系统，发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性，为更经济高效地开发多模态AI系统指明了新方向，同时也揭示了AI感知反思能力不足的局限性。

至顶网科技行者 2025-09-15 11:06:51

亚马逊研究团队推出BeepBank-500：让电子音效研究变得像搭积木一样简单

亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集，包含300-500个参数化合成电子音效，专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试，音频采用CC0-1.0许可证完全开放，填补了电子音效研究领域缺乏标准化工具的空白，为心理声学和人机交互研究提供了便捷的实验材料。

至顶网科技行者 2025-10-13 09:02:05

zELO训练法：让AI排序更懂人心的新方法

ZeroEntropy团队提出zELO训练方法，借鉴象棋ELO评分系统，通过AI模型两两比较文档相关性来训练重排序器。该方法避免了传统人工标注的高成本问题，训练出的zerank模型在多个领域测试中显著超越商业竞争对手，同时开源了模型权重和训练工具，为AI搜索技术发展提供了新的训练范式。

至顶网科技行者 2025-09-29 14:28:46

多模态AI学会了自己"动手"：清华、科大携手Kwai发布会自主编程处理图像的智能助手

清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破，让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法，Thyme在近20个评测基准上都表现出显著性能提升，特别是在高分辨率图像处理和复杂推理任务中表现突出，代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。

至顶网科技行者 2025-08-19 12:35:48

ByteDance的双模型机器人导航系统：让移动机器人像人一样聪明地到处走动

ByteDance Seed团队开发了名为Astra的革命性双模型机器人导航系统，让机器人具备类似人类的环境理解和导航能力。该系统包含Astra-Global和Astra-Local两个模块，前者负责理解自然语言指令和全局定位，后者处理局部路径规划和避障。通过创新的混合拓扑-语义地图、4D时空编码器和掩码ESDF损失等技术，系统在仓库、办公楼等复杂环境中实现了84%-99%的高成功率，显著超越传统方法，为智能机器人助手的实现奠定了重要基础。

至顶网科技行者 2025-06-13 08:04:11

KAIST团队突破性视频检索技术：让AI在视频海洋中精准找到你想要的答案

KAIST研究团队开发的VideoRAG系统实现了人工智能在视频内容理解上的重大突破。该系统能够直接从海量视频中检索相关内容并生成准确答案，解决了传统方法只能处理文字和图片信息的局限。通过智能帧选择和多模态信息融合技术，VideoRAG在问答准确性上显著超越现有方法，为教育培训、技能学习等领域提供了全新的智能问答解决方案。

至顶网科技行者 2025-09-18 11:06:33

代码验证能否做到既快又准？威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

威斯康星大学研究团队提出"生成-筛选-排序"策略，通过结合快速筛选器和智能奖励模型，在AI代码验证中实现了11.65倍速度提升，准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码，再用神经网络模型精确排序，有效解决了传统方法在速度与准确性之间的两难选择，为实用化AI编程助手铺平了道路。

至顶网科技行者 2025-06-19 17:00:12