搜索 ku游娱乐代理【網纸——YB233典CN—

Accenture研究团队推出MCP-Bench：让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench评估基准，通过连接28个真实服务器和250个工具构建复杂任务生态系统，测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟，但在多工具协调和长期规划方面仍面临重大挑战，为AI助手发展指明新方向。

至顶网科技行者 2025-09-04 09:59:03

复旦大学推出OmniAVS：让AI看懂、听懂并解释视频中的每一个细节

复旦大学研究团队推出OmniAVS数据集和OISA系统，实现AI对音视频内容的全模态理解和推理。该系统支持8种表达方式的复合指令，能同时处理文字、语音、声音、图片信息，不仅准确识别目标对象还能解释判断过程。在多项测试中表现出色，为智能教学、医疗诊断、安全监控等领域应用奠定基础。

至顶网科技行者 2025-08-05 13:23:39

得翼通信创始人&CEO：外挂RPU，捅破射频天花板

　2024上海世界移动通信大会期间，得翼通信以射频领域新锐之姿，正式发布了全球首款RPU(Radio Processing Unit)射频增强处理器和解决方案。

至顶网业界供稿 2024-07-18 13:56:29

SVGenius基准测试：大语言模型在SVG理解、编辑和生成方面的全面评估

浙江大学研究团队开发的SVGenius是首个综合评估大语言模型SVG处理能力的基准测试系统。该研究涵盖2,377个测试样例，评估了22种主流AI模型在理解、编辑和生成三个维度上的表现。结果显示，虽然专有模型如Claude和GPT-4o表现最佳，但随着SVG复杂度增加，所有模型性能都明显下降；强化推理训练比单纯扩大模型规模更有效；风格转换是最具挑战性的任务。这一研究为开发更先进的AI辅助设计工具提供了关键见解，有望推动矢量图形技术发展和设计工作流程变革。

至顶网科技行者 2025-06-08 09:31:21

从看图说话到看视频聊天：Salesforce带来史上最强多模态理解新突破

本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准，首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线，展示了从专门化向通用化发展的重要趋势，为多媒体内容理解、智能搜索和人机交互带来突破性进展。

至顶网科技行者 2025-07-11 09:52:55

AI终于学会了记忆：南洋理工大学团队让虚拟世界永不遗忘的突破性进展

南洋理工大学研究团队开发了WorldMem框架，首次让AI拥有真正的长期记忆能力，解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景，并使用智能检索机制，让AI能准确重现之前的场景和事件，即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色，为游戏、自动驾驶、机器人等领域带来广阔应用前景。

至顶网科技行者 2025-07-11 15:23:52

微软推出RealPlay：用AI把游戏世界变成现实世界的神奇技术

微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练，却能控制现实中的汽车、自行车和行人运动，控制成功率达90%。RealPlay支持交互式视频生成，用户可像玩游戏般逐步指导视频发展，生成质量接近真实拍摄，为AI视频生成和未来游戏引擎开发开辟了新方向。

至顶网科技行者 2025-06-27 10:27:10

北京大学团队突破性进展：让AI从看懂动作变成创造表演者

北京大学团队开发的ReMoMask系统实现了文本到3D人体动作生成的重大突破，通过双向动量学习、语义时空注意力和检索增强指导三项核心创新，在权威数据集上取得显著性能提升，为电影制作、游戏开发、虚拟现实等领域提供了高质量的动作生成解决方案，标志着人工智能向更自然人机交互迈进的重要进展。

至顶网科技行者 2025-08-07 14:19:08

斯坦福大学突破性视频生成技术：让AI记住更多画面还不"跑偏"的FramePack方法

斯坦福大学研究团队提出FramePack技术，通过几何级数压缩和反向采样策略，有效解决了AI视频生成中的遗忘-漂移矛盾问题。该方法实现了固定计算复杂度下的任意长度视频生成，在多项评估指标上表现优异，为AI视频生成领域带来重要突破。

至顶网科技行者 2025-07-15 11:34:20

CMU首创游戏开发者AI测试平台——当代码助手开始做游戏会发生什么

卡内基梅隆大学研究团队创建了首个游戏开发AI测试平台GameDevBench，包含132个源于真实开发场景的任务。测试发现最优AI模型成功率仅54.5%，在视觉相关任务上表现更差。研究团队开发的视觉辅助工具显著改善了AI表现，为多模态AI在创意领域的应用提供了重要见解。

至顶网科技行者 2026-02-13 08:30:28

波士顿大学揭秘：只听声音就能"看见"说话者，AI如何读懂声音里的视觉密码

波士顿大学研究团队开发出Audio2Face人工智能系统，能够仅通过音频信号生成对应的面部动画。该技术通过深度学习分析声音中的细微特征，准确率达87.3%，可应用于视频通话、影视制作、教育康复等领域。研究揭示了声音与视觉之间的深层联系，为跨模态人工智能开辟新方向，但也带来隐私保护和技术滥用等挑战。

至顶网科技行者 2025-08-29 12:03:48

小模型也能当金融顾问？新数据训练法让8B模型媲美32B巨头

Perfios公司研究团队开发了创新的AI理财顾问训练框架，通过行为心理学驱动的数据生成方法，让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能，同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段，显著提升了AI建议的个性化程度和人性化表达，为普及化AI理财服务提供了技术路径。

至顶网科技行者 2025-09-30 10:51:12

创新再升级，办公更智慧华为MateBook系列多款新品齐发

全球首款i9 Evo认证笔记本电脑华为MateBook 16s i9版本、华为首款大屏高性能轻巧本华为MateBook D 16、华为MateBook 14、华为MateBook D 14、华为显示器新成员华为MateView SE以及全新华为无线鼠标同台发布。

至顶网业界供稿 2022-05-23 21:56:01

上海交大团队发布"画图变3D场景"神器：一张照片瞬间生成完整的三维世界

上海交通大学团队开发的SceneGen系统能够从单张照片自动生成完整3D场景，包含准确的几何结构、逼真纹理和正确的空间关系。该技术在两分钟内完成场景重建，几何精度比现有方法提升76%，为游戏开发、室内设计、虚拟现实等领域提供了革命性的内容创建工具，代码已开源供研究使用。

至顶网科技行者 2025-08-28 14:52:56

18位戴尔易安信顶级专家分享2019计算发展趋势

服务器，我们将它视为现代数据中心的基石，无论是当下热门的AI/ML/DL还是区块链等，都与计算紧密相连。

至顶网至顶网云计算频道 2019-02-28 10:45:40

HTC VIVE发布多款高品质虚拟现实产品，以“软硬双擎”驱动VR新纪元

HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2，发布VIVE BUSINESS商用平台，为商用和消费者VR设定了新的基准。

至顶网业界供稿 2021-05-12 10:20:43

NVIDIA发布Nemotron Nano 2：小身材大智慧，让AI推理速度飞跃6倍

NVIDIA发布Nemotron Nano 2混合AI模型，采用创新的Mamba-Transformer架构，在保持90亿参数规模的同时，实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色，支持15种语言，能在单GPU上处理12.8万字符长文本，为高效AI应用开辟了新路径。

至顶网科技行者 2025-09-09 10:35:07

ShanghaiTech大学最新成果：让3D模型像变形金刚一样自动分解，一键实现爆炸图生成

ShanghaiTech大学研究团队开发了BANG系统，能让3D模型像变形金刚一样自动分解成零部件，生成爆炸图。该系统采用"生成式爆炸动力学"技术，通过AI深度学习理解物体结构逻辑，实现从完整到分解的平滑过渡。相比传统表面分割方法，BANG能处理内部结构，生成完整体积部件，处理速度提升8倍以上。系统支持语言控制和2D交互，可应用于3D打印、教育展示、产品设计等领域，为3D智能应用开创新范式。

至顶网科技行者 2025-08-06 11:07:46

突破性技术让AI变得更聪明：西湖大学团队彻底改变多模态AI的"记忆负担"

西湖大学研究团队发表突破性论文，提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上，同时保持90%以上的准确率，有望解决当前AI系统"记忆不够用"的核心问题，为智能手机、医疗影像、自动驾驶等领域带来重大突破。

至顶网科技行者 2025-08-04 13:34:06

西门子的“新模式”，为什么能拉快数字化转型的“进度条”？

我们为什么需要一家数字化转型的“新店”？

至顶网周雅 2023-09-27 13:14:32