用了 0.050390秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3540 条
  • 大语言模型与知识图谱强强联手:问答系统的完美协作与未来机遇

    这篇研究综述探讨了大语言模型(LLMs)与知识图谱(KGs)在问答系统中的结合方式。研究者提出新的分类法,根据问答类型和KG角色将方法分为:KG作为背景知识、推理指南或验证器。文章系统性分析了各种复杂问答类型(多文档、多模态、多跳、会话式、可解释和时间问答)的挑战,及其解决方案。尽管LLM与KG结合能有效解决推理能力有限、知识过时和幻觉等问题,但仍面临效率与效果平衡、知识动态更新和公平性等挑战。未来研究应关注开发能高效整合最新知识的框架,以及提升推理、解释和公平性的方法。
    至顶网  科技行者  2025-06-04 09:15:48  
  • ENERVERSE-AC:通过动作条件打造身临其境的机器人仿真环境

    ENERVERSE-AC(EVAC)是一种创新的动作条件世界模型,它能根据机器人预测的动作生成未来视觉观察结果,实现真实且可控的机器人仿真。该研究由AgiBot、上海交通大学和香港中文大学的研究团队开发,通过多层动作条件注入机制和射线图编码技术,支持动态多视角图像生成。EVAC不仅作为数据引擎可增强训练数据多样性,还能作为政策评估器模拟环境响应,无需物理机器人即可进行政策测试,显著降低了开发成本。实验结果表明,EVAC生成的仿真与真实世界场景高度一致,为机器人模仿学习提供了高效、经济的解决方案。
    至顶网  科技行者  2025-05-19 14:59:48  
  • 蚂蚁集团推出UI-Venus:让AI也能像人一样"看懂"并操作电脑界面

    蚂蚁集团推出UI-Venus系统,这是一个能够仅通过屏幕截图就理解和操作用户界面的AI模型。该系统采用强化微调技术,在多个基准测试中达到业界最佳水平,其72B版本在界面识别任务上准确率达95.3%,在复杂的安卓操作任务中成功率达65.9%。研究团队还开发了创新的自进化轨迹对齐技术,显著提升了AI在多步骤任务中的规划能力,为智能化人机交互开辟了新途径。
    至顶网  科技行者  2025-08-19 10:18:56  
  • 谷歌DeepMind重磅发布:AI如何像人类一样学会"举一反三"的思考艺术

    谷歌DeepMind团队提出STAR方法,通过模仿苏格拉底教学法让AI学会类比推理,解决传统AI无法"举一反三"的问题。实验显示该方法显著提升AI处理新问题的能力,在逻辑推理准确率从40%提升至75%以上。这项突破为创造真正智能的AI系统指明方向,未来将在教育、医疗、创意设计等领域产生重要应用价值。
    至顶网  科技行者  2025-07-28 11:50:38  
  • KAIST团队突破性创新:让AI视频生成像调色师一样精确控制每一帧画面

    韩国KAIST团队开发出革命性的"Frame Guidance"技术,这是首个无需训练即可精确控制AI视频生成的通用方法。该技术通过创新的潜在切片和视频潜在优化策略,将内存使用量减少60倍,让普通用户也能精确控制视频中任意帧的内容。实验表明,该方法在关键帧引导、风格化生成等任务上全面超越现有技术,为AI视频创作开启了全新可能。
    至顶网  科技行者  2025-06-16 09:36:15  
  • 重磅丨航天信息全力推进转型升级高质量发展十问十答

    当前,数字经济加速发展,内外部环境深刻变化,航天信息股份有限公司面临前所未有的发展机遇与挑战。
    至顶网  业界供稿  2024-02-01 17:28:40  
  • 2022华为全球分析师大会:聚集当下和未来进行创新

    华为第19届全球分析师大会在深圳开幕。
    至顶网  至顶网物联网频道  2022-04-26 17:22:03  
  • 让AI学会"以史为鉴,向未来学习":北京大学与清华大学联合提出时间自奖励语言模型

    这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。
    至顶网  科技行者  2025-08-14 10:28:59  
  • Patronus AI突破性发现:大模型在复杂任务中的真实弱点,错误率竟高达89%

    Patronus AI发布突破性研究,构建了首个系统性AI代理错误评估体系TRAIL,涵盖148个真实案例和21种错误类型。研究发现即使最先进的AI模型在复杂任务错误识别上准确率仅11%,揭示了当前AI代理系统在长文本处理、推理能力和自我监控方面的重大局限,为构建更可靠的AI系统指明方向。
    至顶网  科技行者  2025-07-09 11:59:36  
  • 南开大学团队推出DepthAnything-AC:让AI在恶劣天气中也能精准"看懂"距离

    南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。
    至顶网  科技行者  2025-07-04 10:32:53  
  • 谷歌DeepMind重磅研究:AI智能体经济体如何重塑人类社会运作模式

    这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
    至顶网  科技行者  2025-09-25 14:43:07  
  • 中科大团队的惊人突破:让AI学会像人一样熟练使用工具!

    中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的关键影响,为AI工具使用能力评估建立了新标准。
    至顶网  科技行者  2025-09-25 14:41:33  
  • 没有视觉数据也能让AI变聪明?ETH苏黎世等机构揭秘无监督视觉语言模型适应新秘诀

    这项ETH苏黎世等机构的综述研究首次从无标签视觉数据可用性角度系统分析视觉语言模型的无监督适应问题,提出了包含无数据迁移、无监督领域迁移、批次测试时适应和在线测试时适应四种场景的分类框架,详细梳理了每种场景下的核心方法和策略,为该领域提供了全面的理论指导和实践参考,推动AI向更灵活自主的方向发展。
    至顶网  科技行者  2025-08-13 10:56:49  
  • 从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

    本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
    至顶网  科技行者  2025-07-11 09:52:55  
  • GATE:沙特研究团队打造高性能阿拉伯语文本嵌入模型,比OpenAI还强25%

    来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。
    至顶网  科技行者  2025-06-05 09:32:47  
  • 音乐AI的大考验:伦敦玛丽女王大学开发全新评测体系,揭示当前音乐智能模型的真实水平

    伦敦玛丽女王大学研究团队开发了CMI-Bench音乐AI评测基准,首次对11个主流音乐AI模型进行全面测试。结果显示这些模型在标准化评测中表现远低于预期,普遍不如传统专业软件,还存在明显文化偏见和性别偏见,为音乐AI发展提供了重要警示。
    至顶网  科技行者  2025-06-24 13:48:51  
  • 上海交通大学团队突破药物发现瓶颈:AI"侦探"能在千万化合物中精准找到最佳药物分子

    上海交通大学团队开发的AuroBind人工智能系统在药物发现领域取得重大突破,能在3000万化合物中精准筛选出高效药物候选分子,命中率达7-69%,比传统方法高数十倍。该系统成功发现了包括220皮摩尔超强效化合物在内的多个新药分子,特别是为从未被攻克的孤儿受体找到了有效化合物,为解决96%未开发蛋白质靶点的药物发现难题提供了新途径。
    至顶网  科技行者  2025-08-08 09:50:00  
  • 世界模型的全新架构:卡内基梅隆大学团队提出PAN模型,让AI拥有"大脑中的虚拟世界"

    卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
    至顶网  科技行者  2025-07-18 09:35:00  
  • 微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?

    微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。
    至顶网  至顶AI实验室  2025-08-29 18:38:02  
  • 康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域

    康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误率,且推理时无额外计算成本,为跨域语音识别提供了高效实用的解决方案。
    至顶网  科技行者  2025-10-09 12:20:45  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号