用了 0.091832秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3643 条
  • 没有视觉数据也能让AI变聪明?ETH苏黎世等机构揭秘无监督视觉语言模型适应新秘诀

    这项ETH苏黎世等机构的综述研究首次从无标签视觉数据可用性角度系统分析视觉语言模型的无监督适应问题,提出了包含无数据迁移、无监督领域迁移、批次测试时适应和在线测试时适应四种场景的分类框架,详细梳理了每种场景下的核心方法和策略,为该领域提供了全面的理论指导和实践参考,推动AI向更灵活自主的方向发展。
    至顶网  科技行者  2025-08-13 10:56:49  
  • 从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

    本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
    至顶网  科技行者  2025-07-11 09:52:55  
  • GATE:沙特研究团队打造高性能阿拉伯语文本嵌入模型,比OpenAI还强25%

    来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。
    至顶网  科技行者  2025-06-05 09:32:47  
  • 音乐AI的大考验:伦敦玛丽女王大学开发全新评测体系,揭示当前音乐智能模型的真实水平

    伦敦玛丽女王大学研究团队开发了CMI-Bench音乐AI评测基准,首次对11个主流音乐AI模型进行全面测试。结果显示这些模型在标准化评测中表现远低于预期,普遍不如传统专业软件,还存在明显文化偏见和性别偏见,为音乐AI发展提供了重要警示。
    至顶网  科技行者  2025-06-24 13:48:51  
  • 上海交通大学团队突破药物发现瓶颈:AI"侦探"能在千万化合物中精准找到最佳药物分子

    上海交通大学团队开发的AuroBind人工智能系统在药物发现领域取得重大突破,能在3000万化合物中精准筛选出高效药物候选分子,命中率达7-69%,比传统方法高数十倍。该系统成功发现了包括220皮摩尔超强效化合物在内的多个新药分子,特别是为从未被攻克的孤儿受体找到了有效化合物,为解决96%未开发蛋白质靶点的药物发现难题提供了新途径。
    至顶网  科技行者  2025-08-08 09:50:00  
  • 世界模型的全新架构:卡内基梅隆大学团队提出PAN模型,让AI拥有"大脑中的虚拟世界"

    卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
    至顶网  科技行者  2025-07-18 09:35:00  
  • 微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?

    微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。
    至顶网  至顶AI实验室  2025-08-29 18:38:02  
  • 上海AI实验室携手港中文首创"隐喻星辰":让AI读懂图像背后的深层含义

    这项研究首次提出MetaphorStar框架,专门解决AI系统无法理解图像隐喻含义的问题。通过创新的TFQ格式和强化学习方法,让AI从只能识别"一个人站在路口"提升到理解"人生选择"的深层含义。在基准测试中性能平均提升82.6%,为开发具有深层认知能力的智能系统开辟了新路径。
    至顶网  科技行者  2026-02-14 10:31:21  
  • 康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域

    康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误率,且推理时无额外计算成本,为跨域语音识别提供了高效实用的解决方案。
    至顶网  科技行者  2025-10-09 12:20:45  
  • 科学家用AI破解蛋白质"变形记":从一维密码到三维杰作的终极翻译器

    这项由Google DeepMind团队完成的研究开发了AlphaFold系统,能够从氨基酸序列准确预测蛋白质三维结构。在CASP14竞赛中,系统达到92.4分的惊人准确度,远超传统方法。该技术正在革命性地改变药物研发、基础生物学研究等领域,为科学家提供了快速获取蛋白质结构信息的强大工具,标志着计算生物学的重大突破。
    至顶网  科技行者  2025-09-22 10:24:38  
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • 机器人学会"看图说话":华盛顿大学让机器人像人类一样理解任务

    华盛顿大学研究团队开发的PEEK系统通过视觉语言模型为机器人提供路径和重点区域指导,实现了机器人操作任务的零样本泛化。该系统将复杂的环境理解交给专门的视觉模型处理,让机器人专注于动作执行,在真实环境测试中将成功率提升了41.4倍。这种模块化设计方法具有广泛的通用性,可适配多种不同类型的机器人平台。
    至顶网  科技行者  2025-10-14 22:44:27  
  • 伯克利团队揭秘:AI"思考方式"大比拼,哪种最聪明?

    伯克利大学研究团队通过测试15个AI模型在五种推理策略上的表现,发现AI的"思考方式"直接影响答题效果。大模型可灵活运用各种策略,小模型需精准匹配任务特点。数学题适合步骤式推理,开放问题需要搜索式方法,效率优先场景宜选简洁策略。研究揭示了AI推理能力的规模门槛效应。
    至顶网  科技行者  2025-10-16 15:12:41  
  • Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合

    Spotify研究团队通过系统性实验发现,传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测,为每个物品生成既适合搜索又适合推荐的统一身份证,在两个任务中都达到良好平衡效果,为构建下一代生成式推荐系统提供了重要技术路径。
    至顶网  科技行者  2025-08-28 11:07:03  
  • GPTailor:让大模型"瘦身"不再难!马克斯·普朗克研究所推出革命性AI模型压缩技术

    马克斯·普朗克研究所推出GPTailor技术,通过多模型智能融合实现大语言模型25%参数削减的同时保持97%性能,为AI模型高效部署提供新思路。该方法将模型压缩从单一模型"减法"转变为多专业模型"重组融合",在14项基准测试中显著优于传统压缩方法。
    至顶网  科技行者  2025-07-01 09:54:07  
  • 复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

    复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
    至顶网  科技行者  2025-07-11 10:15:30  
  • 万字长文 | 对话UiPath掌门人:巨头的产品是外卖送的塑料叉子

    关于机器人流程自动化的一切,以及先锋厂商UiPath的成长路径。
    至顶网  海外来电  2022-07-13 10:54:38  
  • 关于 AI 版权的可怕真相:没人知道接下来会发生什么

    过去一年间,AI模型迎来一波蓬勃发展。无数模型开始通过学习作品创造出新的艺术、音乐和代码。但随着工具的逐渐强大,悬而未决的法律难题可能会影响到该领域的未来。
    至顶网  The Verge  2022-11-18 15:16:33  
  • 大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准

    NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
    至顶网  科技行者  2025-06-16 11:29:36  
  • ShanghaiTech大学最新成果:让3D模型像变形金刚一样自动分解,一键实现爆炸图生成

    ShanghaiTech大学研究团队开发了BANG系统,能让3D模型像变形金刚一样自动分解成零部件,生成爆炸图。该系统采用"生成式爆炸动力学"技术,通过AI深度学习理解物体结构逻辑,实现从完整到分解的平滑过渡。相比传统表面分割方法,BANG能处理内部结构,生成完整体积部件,处理速度提升8倍以上。系统支持语言控制和2D交互,可应用于3D打印、教育展示、产品设计等领域,为3D智能应用开创新范式。
    至顶网  科技行者  2025-08-06 11:07:46  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号