用了 0.051890秒,为您找到ku 娱乐 代理 網纸 YB233相关内容4001 条
  • Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

    Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。
    至顶网  科技行者  2025-09-04 09:59:03  
  • 复旦大学推出OmniAVS:让AI看懂、听懂并解释视频中的每一个细节

    复旦大学研究团队推出OmniAVS数据集和OISA系统,实现AI对音视频内容的全模态理解和推理。该系统支持8种表达方式的复合指令,能同时处理文字、语音、声音、图片信息,不仅准确识别目标对象还能解释判断过程。在多项测试中表现出色,为智能教学、医疗诊断、安全监控等领域应用奠定基础。
    至顶网  科技行者  2025-08-05 13:23:39  
  • 得翼通信创始人&CEO:外挂RPU,捅破射频天花板

     2024上海世界移动通信大会期间,得翼通信以射频领域新锐之姿,正式发布了全球首款RPU(Radio Processing Unit)射频增强处理器和解决方案。
    至顶网  业界供稿  2024-07-18 13:56:29  
  • SVGenius基准测试:大语言模型在SVG理解、编辑和生成方面的全面评估

    浙江大学研究团队开发的SVGenius是首个综合评估大语言模型SVG处理能力的基准测试系统。该研究涵盖2,377个测试样例,评估了22种主流AI模型在理解、编辑和生成三个维度上的表现。结果显示,虽然专有模型如Claude和GPT-4o表现最佳,但随着SVG复杂度增加,所有模型性能都明显下降;强化推理训练比单纯扩大模型规模更有效;风格转换是最具挑战性的任务。这一研究为开发更先进的AI辅助设计工具提供了关键见解,有望推动矢量图形技术发展和设计工作流程变革。
    至顶网  科技行者  2025-06-08 09:31:21  
  • 从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

    本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
    至顶网  科技行者  2025-07-11 09:52:55  
  • AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

    南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
    至顶网  科技行者  2025-07-11 15:23:52  
  • 微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术

    微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
    至顶网  科技行者  2025-06-27 10:27:10  
  • 北京大学团队突破性进展:让AI从看懂动作变成创造表演者

    北京大学团队开发的ReMoMask系统实现了文本到3D人体动作生成的重大突破,通过双向动量学习、语义时空注意力和检索增强指导三项核心创新,在权威数据集上取得显著性能提升,为电影制作、游戏开发、虚拟现实等领域提供了高质量的动作生成解决方案,标志着人工智能向更自然人机交互迈进的重要进展。
    至顶网  科技行者  2025-08-07 14:19:08  
  • 斯坦福大学突破性视频生成技术:让AI记住更多画面还不"跑偏"的FramePack方法

    斯坦福大学研究团队提出FramePack技术,通过几何级数压缩和反向采样策略,有效解决了AI视频生成中的遗忘-漂移矛盾问题。该方法实现了固定计算复杂度下的任意长度视频生成,在多项评估指标上表现优异,为AI视频生成领域带来重要突破。
    至顶网  科技行者  2025-07-15 11:34:20  
  • CMU首创游戏开发者AI测试平台——当代码助手开始做游戏会发生什么

    卡内基梅隆大学研究团队创建了首个游戏开发AI测试平台GameDevBench,包含132个源于真实开发场景的任务。测试发现最优AI模型成功率仅54.5%,在视觉相关任务上表现更差。研究团队开发的视觉辅助工具显著改善了AI表现,为多模态AI在创意领域的应用提供了重要见解。
    至顶网  科技行者  2026-02-13 08:30:28  
  • 波士顿大学揭秘:只听声音就能"看见"说话者,AI如何读懂声音里的视觉密码

    波士顿大学研究团队开发出Audio2Face人工智能系统,能够仅通过音频信号生成对应的面部动画。该技术通过深度学习分析声音中的细微特征,准确率达87.3%,可应用于视频通话、影视制作、教育康复等领域。研究揭示了声音与视觉之间的深层联系,为跨模态人工智能开辟新方向,但也带来隐私保护和技术滥用等挑战。
    至顶网  科技行者  2025-08-29 12:03:48  
  • 小模型也能当金融顾问?新数据训练法让8B模型媲美32B巨头

    Perfios公司研究团队开发了创新的AI理财顾问训练框架,通过行为心理学驱动的数据生成方法,让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能,同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段,显著提升了AI建议的个性化程度和人性化表达,为普及化AI理财服务提供了技术路径。
    至顶网  科技行者  2025-09-30 10:51:12  
  • 创新再升级,办公更智慧 华为MateBook系列多款新品齐发

    全球首款i9 Evo认证笔记本电脑华为MateBook 16s i9版本、华为首款大屏高性能轻巧本华为MateBook D 16、华为MateBook 14、华为MateBook D 14、华为显示器新成员华为MateView SE以及全新华为无线鼠标同台发布。
    至顶网  业界供稿  2022-05-23 21:56:01  
  • 上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界

    上海交通大学团队开发的SceneGen系统能够从单张照片自动生成完整3D场景,包含准确的几何结构、逼真纹理和正确的空间关系。该技术在两分钟内完成场景重建,几何精度比现有方法提升76%,为游戏开发、室内设计、虚拟现实等领域提供了革命性的内容创建工具,代码已开源供研究使用。
    至顶网  科技行者  2025-08-28 14:52:56  
  • 18位戴尔易安信顶级专家分享2019计算发展趋势

    服务器,我们将它视为现代数据中心的基石,无论是当下热门的AI/ML/DL还是区块链等,都与计算紧密相连。
    至顶网  至顶网云计算频道  2019-02-28 10:45:40  
  • HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元

    HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
    至顶网  业界供稿  2021-05-12 10:20:43  
  • NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍

    NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。
    至顶网  科技行者  2025-09-09 10:35:07  
  • ShanghaiTech大学最新成果:让3D模型像变形金刚一样自动分解,一键实现爆炸图生成

    ShanghaiTech大学研究团队开发了BANG系统,能让3D模型像变形金刚一样自动分解成零部件,生成爆炸图。该系统采用"生成式爆炸动力学"技术,通过AI深度学习理解物体结构逻辑,实现从完整到分解的平滑过渡。相比传统表面分割方法,BANG能处理内部结构,生成完整体积部件,处理速度提升8倍以上。系统支持语言控制和2D交互,可应用于3D打印、教育展示、产品设计等领域,为3D智能应用开创新范式。
    至顶网  科技行者  2025-08-06 11:07:46  
  • 突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

    西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
    至顶网  科技行者  2025-08-04 13:34:06  
  • 西门子的“新模式”,为什么能拉快数字化转型的“进度条”?

    我们为什么需要一家数字化转型的“新店”?
    至顶网  周雅  2023-09-27 13:14:32  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号