用了 0.024515秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • 大模型能否欺骗CLIP?通过文本更新测试预训练多模态表示的对抗组合能力

    首尔国立大学研究团队提出了"多模态对抗组合性"(MAC)基准测试,评估预训练多模态表示(如CLIP)在理解文本与图像、视频、音频关系时的组合性弱点。研究使用大语言模型生成欺骗性文本,通过样本成功率和多样性双重指标进行评估。团队创新性地提出了多样性促进自训练方法,即使使用较小的Llama-3.1-8B模型,也能显著提高攻击成功率和多样性。实验在COCO、MSRVTT和AudioCaps数据集上验证,该方法优于现有技术,并展示了良好的跨模型迁移性,为构建更可靠的多模态系统提供了重要见解。
    至顶网  科技行者  2025-06-03 13:45:40  
  • 西安交通大学与蚂蚁集团联合发布:AI如何真正理解人类情感并给出贴心回应

    西安交通大学与蚂蚁集团联合发布HumanSense研究,首次建立了AI情感智能的系统性评估框架。通过3882道真实场景测试题,研究发现当前最先进AI在人际互动理解方面仍有巨大提升空间,人类得分87.5%而AI仅57.8%。研究团队通过多阶段强化学习训练,成功提升了AI的多模态推理能力,让AI学会像心理咨询师一样观察、理解和回应人类情感,为开发更具共情能力的AI系统奠定了重要基础。
    至顶网  科技行者  2025-08-19 10:18:43  
  • 剑桥大学发布突破性研究:让AI学会从人类行为中"看穿"真实意图的新方法

    剑桥大学研究团队发布突破性研究,提出通过逆强化学习让AI从人类行为中推断真实意图的新方法。该方法解决了大语言模型训练中的关键挑战,包括缺乏明确奖励信号、计算资源需求巨大等问题。通过观察人类偏好数据而非直接指令,AI能更好地理解复杂的人类价值观,在对话、数学推理等领域表现显著提升。
    至顶网  科技行者  2025-07-24 16:26:01  
  • 太阳队争夺NBA总冠军的“神秘球员”——5G

    在处理球员数据、寻求成绩提升方法的过程中,无线技术为太阳队带来了强大的竞争优势。
    至顶网  科技行者  2021-08-20 16:27:51  
  • 小冰“森林”初长成

    小冰已经诞生八年,代级进入第九代,身影遍布各行各业。
    至顶网  高玉娴  2022-04-11 18:09:50  
  • QwenLong-L1:阿里巴巴用强化学习打造的长文本推理模型,超越OpenAI-o3-mini

    阿里巴巴Qwen-Doc团队推出的QwenLong-L1框架通过强化学习解决了大型语言模型长文本推理的关键挑战。该框架采用渐进式上下文扩展策略,包含热身监督微调、课程引导分阶段强化学习和难度感知回顾采样三大核心组件。实验表明,QwenLong-L1-32B在七项长文本文档问答基准测试上平均提升5.1个百分点,超越OpenAI-o3-mini等旗舰模型,达到与Claude-3.7-Sonnet-Thinking相当的性能水平,为发展具备强大上下文理解和推理能力的实用长文本语言模型开辟了新路径。
    至顶网  科技行者  2025-05-29 08:18:16  
  • 从直觉评分到深度思考:复旦大学和腾讯混元联合开发的"会思考"的AI评审专家

    想象一下,传统的AI评判系统就像是一位只会给出"好"或"不好"评分的艺术评审,而不告诉你为什么这样评价。而这项新研究开发的系统则像是一位能够清晰解释每个评分背后详细思考过程的资深艺术鉴赏家,不仅能告诉你哪个作品更好,还能一步步分析为什么这样认为。
    至顶网  科技行者  2025-05-08 10:28:26  
  • 百万模型的失踪与重生:希伯来大学科学家如何绘制全球AI模型的完整地图

    希伯来大学研究团队提出"模型地图集"概念,系统性解决AI领域模型管理混乱问题。当前150万公开模型中超过60%缺乏文档,研究者难以找到合适模型,造成重复训练和资源浪费。团队开发出绕过权重对称性难题的新方法,能够自动推断模型血统关系和功能属性,已在真实数据上达到80%以上准确率,为构建有序AI生态系统奠定基础。
    至顶网  科技行者  2025-08-04 09:59:05  
  • 重新排列图像块,提升视觉模型性能:加州大学伯克利分校研究突破

    这项由加州大学伯克利分校研究团队开发的REOrder框架,通过重新排列图像块的处理顺序,显著提升了视觉模型性能。研究发现,传统的行主序排列并非最优选择,而通过信息论先验和强化学习寻找最佳排序,可在不修改模型架构的情况下,使ImageNet-1K分类准确率提升3.01%,卫星图像分类提升13.35%。这一发现挑战了传统认知,为视觉模型优化提供了一个全新且易于实施的方向。
    至顶网  科技行者  2025-06-04 09:17:16  
  • 耶鲁大学团队发布SciArena:科学文献助手大比拼,人类专家投票选出最强AI

    这项由耶鲁大学联合纽约大学和艾伦人工智能研究所完成的研究,首次构建了专门针对科学文献任务的AI评估平台SciArena。通过收集超过13000张来自102位真实科学家的投票,研究揭示了当前AI助手在科学文献理解方面的真实水平,同时指出了AI自动评估系统的显著局限性,为科学研究领域的AI应用提供了重要参考。
    至顶网  科技行者  2025-07-03 14:00:07  
  • 8B参数的MiniCPM-V 4.5:小身材大智慧,多模态AI模型的效率革命

    MiniCPM-V 4.5是由清华大学等机构开发的高效多模态AI模型,仅用80亿参数就超越了720亿参数的竞争对手。该模型创新性地采用统一3D重采样器,视频处理效率提升12-24倍;首创文档直接学习方法,无需外部解析工具;实现双模式推理,既能快速回应又能深度思考。在多项基准测试中表现优异,显著降低了AI技术门槛。
    至顶网  科技行者  2025-10-13 15:13:51  
  • 重庆大学团队让AI像病理专家一样聚焦关键信息:突破传统方法的"偷懒"问题

    重庆大学团队提出MHIM-MIL框架,通过"屏蔽困难实例挖掘"策略解决传统医学AI过度依赖简单特征的问题。该方法采用"老师-学生"协作机制,强制AI学习困难病例,在癌症诊断等多个医学任务中显著超越现有方法,同时大幅提升计算效率,为医学AI实际应用提供重要突破。
    至顶网  科技行者  2025-09-28 13:47:57  
  • 破解软件开发的秘密:中科院团队让AI像真正的程序员一样工作

    这项研究提出了SWE-Flow框架,通过测试驱动开发方法自动生成AI编程训练数据。研究团队从真实GitHub项目中构建运行时依赖关系图,将复杂开发任务分解为循序渐进的步骤,生成了16061个训练实例。实验表明,使用该数据训练的AI模型在软件开发任务上表现显著提升,为AI编程能力提升提供了新思路。
    至顶网  科技行者  2025-06-16 14:07:19  
  • 昆字节AI团队重磅发布:让任何人都能试穿万物的神奇技术,告别繁琐操作!

    昆字节AI与浙江大学联合推出OmniTry系统,实现无需手动标注的万物虚拟试穿。该技术通过创新的两阶段训练和"无痕移除"方法,支持服装、珠宝、配饰等12类物品的智能试穿,在保真度和准确性方面显著超越现有技术,为电商和时尚行业带来革命性突破。
    至顶网  科技行者  2025-08-27 15:13:26  
  • 从零开始理解LLMs,使用中学数学

    我们讨论大型语言模型(LLMs)的工作原理,从基础开始——假设您只知道如何加法和乘法。
    至顶网  towardsdatascience  2024-11-07 11:28:56  
  • 链式模型:微软打造的"俄罗斯套娃"语言模型将提高训练效率和推理灵活性

    微软研究院提出Chain-of-Model学习范式,将因果关系融入大型语言模型的隐藏状态。这一创新通过"链式表示"将模型参数分为多个子表示链,使模型能够逐层扩展且保持前序能力。研究成果包括CoLM和CoLM-Air两种实现,实验证明它们不仅性能与标准Transformer相当,还提供了高效训练和灵活推理的优势,包括能够渐进扩展模型规模、提供多尺度子模型以及显著加速预填充计算。这一突破为解决大型语言模型训练成本高和部署缺乏灵活性的问题提供了新思路。
    至顶网  科技行者  2025-05-22 14:01:09  
  • 这个AI助手发明了一个"看图思考"的新技能,能像侦探一样根据需要放大图片寻找线索——香港中文大学团队如何让视觉AI变得更聪明节能

    香港中文大学团队开发的VisionThink系统通过强化学习让AI视觉模型具备了类似人类的智能决策能力,能够根据任务需要动态调整图片处理精度。该系统在节省75%计算资源的同时还提升了识别准确性,在多个视觉任务中表现优于传统方法,为AI视觉系统的高效智能化发展指明了新方向。
    至顶网  科技行者  2025-07-23 19:06:38  
  • 一块屏幕控制所有机器人:香港大学与OpenDriveLab推出的UniVLA让机器人学会在任何环境中行动

    想象一下,你去到一个陌生的国家,那里的人们说着你完全不懂的语言。你会感到无所适从,对吧?在机器人世界中也存在类似的问题。不同种类的机器人就像来自不同国家的人,它们有自己特定的"语言"(动作方式)和"视角"(观察环境的方式)。一个操控机械臂的系统可能完全无法理解如何控制一个移动机器人,就像一个只会说英语的人无法直接理解中文一样。
    至顶网  科技行者  2025-05-13 15:32:34  
  • 大规模文件存储OSS技术与实践

    百分点基于实践探索自主研发出了OSS,可以将海量的网页内容、图片、音视频等非结构化数据,在高并发的场景下被快速、准确的存储及方便的下载。
    至顶网  百分点大数据技术团队  2020-07-02 16:53:30  
  • 北京大学与美团联合破解AI推理难题:像厨师配菜一样让AI学会多路径思考

    北京大学与美团联合研究团队提出轮廓引导路径探索(OPE)方法,解决AI并行推理中的"互信息饱和"问题。通过先生成多样化策略轮廓再执行具体推理,避免多条思路重复收敛的困境。在数学推理测试中,该方法显著提升了复杂问题的解决成功率,为AI推理能力的可靠性提升提供了新的技术路径。
    至顶网  科技行者  2026-02-11 15:59:48  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号