用了 0.043867秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3248 条
  • 没有视觉数据也能让AI变聪明?ETH苏黎世等机构揭秘无监督视觉语言模型适应新秘诀

    这项ETH苏黎世等机构的综述研究首次从无标签视觉数据可用性角度系统分析视觉语言模型的无监督适应问题,提出了包含无数据迁移、无监督领域迁移、批次测试时适应和在线测试时适应四种场景的分类框架,详细梳理了每种场景下的核心方法和策略,为该领域提供了全面的理论指导和实践参考,推动AI向更灵活自主的方向发展。
    至顶网  科技行者  2025-08-13 10:56:49  
  • 从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

    本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
    至顶网  科技行者  2025-07-11 09:52:55  
  • GATE:沙特研究团队打造高性能阿拉伯语文本嵌入模型,比OpenAI还强25%

    来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。
    至顶网  科技行者  2025-06-05 09:32:47  
  • 音乐AI的大考验:伦敦玛丽女王大学开发全新评测体系,揭示当前音乐智能模型的真实水平

    伦敦玛丽女王大学研究团队开发了CMI-Bench音乐AI评测基准,首次对11个主流音乐AI模型进行全面测试。结果显示这些模型在标准化评测中表现远低于预期,普遍不如传统专业软件,还存在明显文化偏见和性别偏见,为音乐AI发展提供了重要警示。
    至顶网  科技行者  2025-06-24 13:48:51  
  • 上海交通大学团队突破药物发现瓶颈:AI"侦探"能在千万化合物中精准找到最佳药物分子

    上海交通大学团队开发的AuroBind人工智能系统在药物发现领域取得重大突破,能在3000万化合物中精准筛选出高效药物候选分子,命中率达7-69%,比传统方法高数十倍。该系统成功发现了包括220皮摩尔超强效化合物在内的多个新药分子,特别是为从未被攻克的孤儿受体找到了有效化合物,为解决96%未开发蛋白质靶点的药物发现难题提供了新途径。
    至顶网  科技行者  2025-08-08 09:50:00  
  • 世界模型的全新架构:卡内基梅隆大学团队提出PAN模型,让AI拥有"大脑中的虚拟世界"

    卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
    至顶网  科技行者  2025-07-18 09:35:00  
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • GPTailor:让大模型"瘦身"不再难!马克斯·普朗克研究所推出革命性AI模型压缩技术

    马克斯·普朗克研究所推出GPTailor技术,通过多模型智能融合实现大语言模型25%参数削减的同时保持97%性能,为AI模型高效部署提供新思路。该方法将模型压缩从单一模型"减法"转变为多专业模型"重组融合",在14项基准测试中显著优于传统压缩方法。
    至顶网  科技行者  2025-07-01 09:54:07  
  • 复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

    复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
    至顶网  科技行者  2025-07-11 10:15:30  
  • 万字长文 | 对话UiPath掌门人:巨头的产品是外卖送的塑料叉子

    关于机器人流程自动化的一切,以及先锋厂商UiPath的成长路径。
    至顶网  海外来电  2022-07-13 10:54:38  
  • 关于 AI 版权的可怕真相:没人知道接下来会发生什么

    过去一年间,AI模型迎来一波蓬勃发展。无数模型开始通过学习作品创造出新的艺术、音乐和代码。但随着工具的逐渐强大,悬而未决的法律难题可能会影响到该领域的未来。
    至顶网  The Verge  2022-11-18 15:16:33  
  • 大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准

    NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
    至顶网  科技行者  2025-06-16 11:29:36  
  • ShanghaiTech大学最新成果:让3D模型像变形金刚一样自动分解,一键实现爆炸图生成

    ShanghaiTech大学研究团队开发了BANG系统,能让3D模型像变形金刚一样自动分解成零部件,生成爆炸图。该系统采用"生成式爆炸动力学"技术,通过AI深度学习理解物体结构逻辑,实现从完整到分解的平滑过渡。相比传统表面分割方法,BANG能处理内部结构,生成完整体积部件,处理速度提升8倍以上。系统支持语言控制和2D交互,可应用于3D打印、教育展示、产品设计等领域,为3D智能应用开创新范式。
    至顶网  科技行者  2025-08-06 11:07:46  
  • 价值引导搜索:提升推理模型思维链的高效指南——康奈尔大学研究团队的突破性成果

    康奈尔大学研究团队提出了"价值引导搜索"方法,通过训练标记级价值模型来优化大型语言模型的推理过程。他们收集了250万个数学推理轨迹,训练了15亿参数的评估模型,实现了基于块的高效搜索。这种方法不需要预定义"步骤"概念,也无需昂贵的每步标注。在四个数学竞赛基准测试中,该方法使DeepSeek-1.5B模型达到了45.7%的平均准确率,与更大模型相当,同时显著减少了计算资源需求。研究团队开源了数据集、模型和代码,为高效人工智能推理提供了新范式。
    至顶网  科技行者  2025-05-29 12:03:07  
  • 玩家秒变造物主!170亿参数AI实时编织你的游戏世界

    当你在《我的世界》中跳跃时,AI能瞬间将你的想法变成脚下奔涌的虚拟河流——Skywork AI的Matrix-Game模型让键盘成为拨动虚拟世界的开关,170亿参数的“造物主”实时编织出符合你意图的动态场景,重新定义人机共舞的未来。
    至顶网  至顶AI实验室  2025-06-30 14:52:25  
  • 智谱AI和清华大学联手打造GLM-4.1V-Thinking:让AI像人类一样深度思考的神奇模型

    智谱AI和清华大学联合发布GLM-4.1V-Thinking视觉语言模型,通过创新的推理导向训练框架,让AI学会像人类一样深度思考后再回答。该模型在多个基准测试中超越了规模更大的竞争对手,并首次在开源社区提供了完整的多模态推理解决方案,为AI技术的实际应用开辟了新路径。
    至顶网  科技行者  2025-07-03 14:00:35  
  • 浙大团队揭秘:为什么AI机器人在现实世界中总是"掉链子"?OmniEAR基准测试暴露惊人真相

    浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
    至顶网  科技行者  2025-08-13 14:36:32  
  • 斯坦福大学发现AI"推理强度调节器":让大语言模型像人一样智能调控思考深度

    斯坦福大学研究团队开发出"分数推理"技术,让AI能够像人类一样根据问题难度智能调节思考深度。该技术通过提取和控制AI内部的"推理强度向量",实现了推理强度的连续调节,在数学推理等任务中显著提升了AI表现。这项无需重新训练的技术为AI推理能力的个性化和自适应化开辟了新方向。
    至顶网  科技行者  2025-07-02 11:02:18  
  • 手机和AR眼镜也能处理超长视频了!汉阳大学团队突破内存限制实现实时视频理解

    韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
    至顶网  科技行者  2025-06-25 17:00:16  
  • 人工智能学会了"无师自通":清华大学团队让AI在没有标准答案的情况下自我进化

    清华大学研究团队开发出TTRL技术,让AI无需标准答案即可自我学习。通过"多数投票"机制,AI分析自己的多个解答找出最佳答案并以此改进。在数学竞赛中表现卓越,AIME 2024正确率提升159%。这种"无师自通"能力标志着AI向真正自主智能迈进的重要突破。
    至顶网  科技行者  2025-07-17 09:26:40  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号