用了 0.050916秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3540 条
  • 葛兰素史克公司是如何利用AI制药的?

    在最近的一期《今日AI》播客中,葛兰素史克公司消费者保健业务美洲创新和新兴技术负责人Subroto Mukherjee,谈到了制药行业是如何使用人工智能和机器学习技术的,且介绍了人工智能和机器学习技术的独特用例。
    至顶网  科技行者  2020-12-28 18:16:26  
  • AI语言模型遇到"混淆问题"时为何表现不佳?印度理工学院等联合研究揭示大模型推理盲区

    印度理工学院等机构研究发现,即使是最先进的AI模型如GPT-4o、Claude等,在面对间接表达、干扰信息或背景过载的"混淆问题"时,准确率会从70-80%骤降至25-40%。研究团队开发的ObfusQAte评估框架首次系统性揭示了大语言模型的这一重要缺陷,为改进AI推理能力和提高实际应用可靠性提供了重要基准。
    至顶网  科技行者  2025-08-18 13:59:16  
  • 首尔大学团队突破:让AI"压缩文档"变得更聪明,就像聪明的图书管理员一样快速找到关键信息

    首尔大学研究团队开发出名为ECoRAG的智能文档压缩框架,解决了AI系统在处理长文档时效率低下和准确性不足的问题。该技术通过"证据性"概念区分有用信息与干扰内容,并具备自我反思能力来决定所需信息量。实验显示,新方法在保持更高准确率的同时,显著减少了处理时间和计算成本,为搜索引擎、在线教育、医疗诊断等领域带来广阔应用前景。
    至顶网  科技行者  2025-06-16 09:44:34  
  • Meta联手多个研究机构推出AU-Net:告别传统分词,AI从字节直接理解语言的革命性突破

    Meta研究团队开发了革命性的AU-Net架构,让AI无需传统分词直接从字节理解语言。这项技术在多语言处理和字符级任务上显著超越传统方法,为AI语言理解开辟了新路径。
    至顶网  科技行者  2025-06-24 13:47:28  
  • 三大首席科学家揭秘:微软小冰是如何长成“德智美”全能型AI的?

    “不管是唱歌作曲,还是写诗画画,其实我们的目的是想让小冰更像人类,这种在艺术、文学等方面的自主性,常常会让我们在某个瞬间产生一种错觉——她好像真的有自我意识。”
    至顶网  高玉娴  2019-11-22 20:21:32  
  • 斯坦福和伯克利联手出招:AI能看出你动作哪里不标准了!

    斯坦福和伯克利研究团队推出VidDiff技术,让AI学会像专业教练一样精准识别动作差异。该技术通过三步走方法解决视频动作比较难题,构建了包含549对视频的大型数据集VidDiffBench。虽然当前AI模型准确率有限,但已展现在健身指导、医学培训、体育分析等领域的应用潜力。研究为AI理解细微动作差异开辟新方向,有望让人人享有智能化的动作指导。
    至顶网  科技行者  2025-07-30 09:51:47  
  • AI助教的新突破:普林斯顿大学团队开发出能"看懂"复杂思维过程的智能评分系统

    普林斯顿大学研究团队开发了ReasonFlux-PRM,这是首个能深度理解AI复杂思维过程的评分系统。不同于传统只看最终答案的评估方法,新系统能评判AI思考轨迹的每个步骤质量,在数学和科学推理任务上实现了平均4.5%-12.1%的性能提升,为AI教育和训练提供了突破性的解决方案。
    至顶网  科技行者  2025-06-26 12:53:02  
  • 人工智能的最后一场考试:当最强AI模型遇上专家级学术难题会发生什么?

    这项由美国AI安全中心和Scale AI等机构联合开展的研究,创建了迄今最具挑战性的AI学术能力测试基准。该测试包含2500道专家级题目,涵盖数十个学科领域,由全球近千名专家贡献。测试结果显示,即使是最先进的AI系统表现也非常有限,准确率普遍在个位数,同时存在严重的"虚假自信"问题。研究揭示了AI系统与人类专家在深度学术能力方面的巨大差距。
    至顶网  科技行者  2025-09-18 11:07:46  
  • 具有记忆力的个性化助手:解析宜远大学团队如何让机器人真正理解你的喜好

    这项研究探讨了具身智能体(如机器人)如何通过记忆为用户提供个性化服务。宜远大学研究团队开发了MEMENTO评估框架,通过两阶段设计评估智能体利用记忆的能力。研究将个性化知识分为物体语义(如"我最喜欢的杯子")和用户模式(如"早餐习惯")两类。实验表明,即使是GPT-4o等前沿模型在需要综合多记忆的任务中也表现出30.5%的性能下降,特别是在理解用户模式方面存在明显挑战。
    至顶网  科技行者  2025-05-30 07:45:49  
  • 高途x人大:在教育的深处,种下“有温度的AI”

    这是一次理念相通、能力互补的“生态耦合”。
    至顶网  于佳卉  2025-10-11 19:10:11  
  • 高途x人大:在教育的深处,种下“有温度的AI”

    这是一次理念相通、能力互补的“生态耦合”。
    至顶网  于佳卉  2025-10-11 19:12:34  
  • 阿里通义团队让AI学会"读心术"——HumanOmniV2如何让机器真正懂人心

    阿里巴巴通义实验室的研究团队开发了HumanOmniV2,这是一个能够真正"读懂"人类复杂意图和情感的AI系统。该系统通过改进强化学习方法,让AI在回答问题前必须先全面理解多模态背景信息,解决了现有AI模型忽略重要线索和缺乏全局理解的问题,在多项测试中表现优异。
    至顶网  科技行者  2025-07-03 13:59:35  
  • 非常时期下的团战——腾讯云与生态伙伴抗“疫”侧记

    疫情当前,腾讯云与合作伙伴共同经历了一场前所未有的战“疫”。在政务、办公协同、教育、医疗、大数据和AI等领域,竭尽全力为疫情防控提供一切力所能及的支持。
    至顶网  业界供稿  2020-02-13 11:34:18  
  • AI+医疗器械的"魔法":更准确、更效率、更能保护隐私

    AI硬件与软件的最新发展,正在彻底改变医疗器械的开发思路,全面重塑实时处理、预测与可视化医疗数据等细分应用领域。如今,AI已经入驻350多种FDA获批医疗器械,并在更多医疗保健场景中为节本增效贡献力量。
    至顶网  至顶网软件与服务频道  2022-07-13 12:37:27  
  • 蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域

    这项由法国蒙彼利埃大学团队开发的iFAM系统,通过创新的两阶段设计解决了AI视觉模型"看错重点"的问题。系统第一阶段识别图像中的关键区域,第二阶段只处理被选中的区域,完全屏蔽背景干扰。在多个挑战性数据集上的实验表明,该方法显著提升了模型对虚假关联的抗性,为医疗诊断、自动驾驶等高风险应用提供了更可靠的技术基础。
    至顶网  科技行者  2025-06-19 10:47:20  
  • 印度理工学院突破性研究:AI医生能否做出正确的心理健康伦理决策?

    印度理工学院研究员创建了首个专门评估心理健康AI伦理推理能力的数据集EthicsMH,包含125个涵盖保密信任、偏见识别、自主权冲突等核心伦理挑战的情境。通过人机合作构建方式和多维评估框架,该工具不仅能测试AI决策准确性,更能评估其推理过程质量和多角度思考能力,为开发更安全负责任的心理健康AI系统提供了重要评估工具和方法论基础。
    至顶网  科技行者  2025-09-26 13:55:41  
  • 14位“人类大佬”如何评价“AI大佬”ChatGPT?

    AI百家谈。
    至顶网  海外来电  2023-04-07 11:16:04  
  • BLEUBERI:当BLEU不再只是一个简单指标,而成为指导大语言模型的强力工具

    这篇文章介绍了马里兰大学研究团队开发的BLEUBERI方法,该方法惊人地发现被认为过于简单的BLEU评分系统在指导大语言模型遵循指令方面非常有效。研究表明,当使用高质量参考答案时,BLEU与人类偏好的一致率可达74.2%,几乎与复杂的奖励模型相当。基于此,团队开发的BLEUBERI方法在多个基准测试中表现与传统奖励模型方法相当,且在事实准确性方面表现更佳。这一发现为语言模型对齐提供了更经济高效的途径,无需大量人类标注数据和复杂的奖励模型训练。
    至顶网  科技行者  2025-05-27 17:12:51  
  • 炼金术士:颠覆性方法让公开文生图数据变黄金 - 仅3350个样本实现突破性提升

    Alchemist是一项由Yandex研究团队开发的创新方法,能将公开文生图数据转化为高效微调资源。研究者利用预训练扩散模型作为数据质量评估器,从海量图像中精选出仅3,350个高价值样本创建数据集。实验表明,这个紧凑数据集能显著提升五种Stable Diffusion模型的生成美学质量和图像复杂度,同时保持风格多样性。研究不仅开源了数据集,还公开了微调模型权重,为AI社区提供了替代专有微调管道的开放解决方案。
    至顶网  科技行者  2025-05-30 10:05:43  
  • Group Think:多个并行推理智能体如何在标记级别协同合作

    这篇研究论文介绍了一种名为"Group Think"的创新方法,让单个大型语言模型能够同时扮演多个并行推理智能体,这些"思考者"能在标记级别相互协作。传统多智能体系统通常采用轮流推理方式,而Group Think实现了实时并行协作,智能体可以看到彼此的部分生成内容并动态调整。实验表明,这种方法不仅提高了推理质量,还显著降低了延迟,特别适合资源有限的边缘设备。研究团队提出了两种高效实现方案,并通过三类代表性问题验证了Group Think的优势。
    至顶网  科技行者  2025-05-21 14:20:30  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号