用了 0.091450秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • 从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

    卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,为AI公司提供了新的知识产权保护手段。
    至顶网  科技行者  2025-07-16 09:13:03  
  • 中科院团队揭秘AI看图说话的"秘密":机器到底在看什么?

    中科院团队开发的EAGLE框架首次实现了对多模态大语言模型决策过程的精确解释,能够揭示AI在生成文字时关注的图片区域,并区分其依赖视觉证据还是语言先验。该方法在准确性上比现有技术提升20%以上,计算资源需求减少80%,在幻觉检测和纠正方面表现卓越,为构建更可信的AI系统提供了重要工具。
    至顶网  科技行者  2025-10-17 14:06:59  
  • MMR-V:视频多模态深度推理的新基准——探究视频中未被言明的内容

    MMR-V是一个创新的视频多模态深度推理基准测试集,专注于评估AI模型在视频长距离多帧推理能力。与现有基准不同,它要求模型不仅理解问题帧,还需在远距离帧中挖掘证据进行推理。研究发现即使最先进的模型o4-mini也仅达到52.5%准确率,远低于人类86%的表现,突显了当前技术局限。研究还揭示传统思维链等增强策略在视频推理中效果有限,并发现添加音频模态可提升性能。这一基准测试为未来视频AI系统发展提供了重要方向。
    至顶网  科技行者  2025-06-09 07:22:05  
  • 华中科技大学团队发明AI"视觉工具使用专家",让计算机像人类一样调用外部工具解决复杂视觉问题

    华中科技大学团队开发的ReVPT系统首次让AI学会像人类一样主动选择和使用视觉分析工具解决复杂问题。通过创新的两阶段强化学习训练,该系统能根据任务需求灵活调用物体检测、深度估计等专业工具,在多项国际测试中显著超越基础模型,部分指标甚至超越商业化产品,为AI视觉推理能力提升开辟了新路径。
    至顶网  科技行者  2025-09-23 11:05:31  
  • 斯坦福大学首创:AI如何像人类一样从语言反馈中学习

    斯坦福大学研究团队在2025年提出了首个从语言反馈学习的理论框架,创新性地引入转移消元维度来衡量语言反馈的信息量,并开发了HELiX算法。研究证明语言反馈能带来指数级学习加速,在多个游戏测试中表现优异,为AI学习从简单数值反馈转向丰富语言指导奠定了理论基础,有望推动教育、推荐系统等领域的AI应用革新。
    至顶网  科技行者  2025-06-23 10:55:28  
  • PrefPalette:Meta和华盛顿大学联手打造会"读心术"的AI偏好预测系统

    Meta和华盛顿大学研究团队开发出PrefPalette系统,首次将认知科学的多属性决策理论引入AI偏好预测。该系统通过分析19个属性维度理解用户偏好形成过程,在Reddit 45个社区测试中准确率比GPT-4o提高46.6%。系统不仅能预测用户喜好,还能解释预测原因,为构建透明可解释的个性化AI奠定基础。
    至顶网  科技行者  2025-07-28 11:50:10  
  • 香港科技大学研究突破:AI智能助手如何在超长对话中保持"记忆力"不衰退

    香港科技大学研究团队发布LOCA-bench测试平台,专门评估AI助手在长时间复杂任务中的表现。研究发现AI存在"上下文腐烂"问题,随着信息量增加,准确率从70%急剧下降至20%以下。研究识别出AI的四大"职场病"并提出多种"记忆增强"技术,其中程序化工具调用法效果最佳,可将准确率提升25%以上。
    至顶网  科技行者  2026-02-10 15:34:49  
  • 智算“破壁者”:华为穿越AI生态周期的两张“底牌”

    在算力“狂飙突进”的表象之下,华为正试图用“鲲鹏”与“昇腾”两张“底牌”,给出新的解题思路。
    至顶网  毛烁  2025-05-26 17:43:59  
  • 微软亚洲研究院新发现:计算机也能像人类一样从说话声音中"听出"面部表情

    微软亚洲研究院开发的AV-DiT系统实现了音视频联合生成的重大突破,能够像人类一样理解声音与面部表情的对应关系。该系统采用扩散变换器架构,通过创新的注意力机制和分层处理策略,实现了高质量的音视频同步生成。实验显示其生成内容接近真实水平,在视频会议、内容创作、教育等领域具有广阔应用前景,代表了多媒体理解技术的重要进展。
    至顶网  科技行者  2025-09-29 14:29:44  
  • 智算“破壁者”:华为穿越AI生态周期的两张“底牌”

    在算力“狂飙突进”的表象之下,华为正试图用“鲲鹏”与“昇腾”两张“底牌”,给出新的解题思路。
    至顶网  毛烁  2025-05-27 15:08:49  
  • 复旦大学团队首创多维约束框架:让AI更听话,不再"一言难尽"

    复旦大学团队开发了全新的多维约束框架来评估和改进大语言模型的指令跟随能力。研究发现AI在处理复杂约束时表现不佳,成功率从简单约束的77%降至复杂约束的33%。通过强化学习训练,模型性能显著提升30-50个百分点且不影响其他能力。研究揭示改进主要来自注意力机制优化,为AI实用化提供了重要突破。
    至顶网  科技行者  2025-07-09 11:53:17  
  • AI智能演示制作助手:让文档秒变生动演讲视频的黑科技来了

    澳大利亚研究团队开发出PresentAgent,这是一个能将任何文档自动转换为专业演示视频的AI系统。该系统集成了文档解析、幻灯片设计、语音合成等功能,并创建了全新的多维度评价体系。实验显示,AI生成的演示视频在多项指标上接近人类专家水平,为教育、商业等领域的演示制作提供了高效解决方案。
    至顶网  科技行者  2025-07-11 09:51:22  
  • 人工智能学会了看懂动作!复旦大学团队的视频识别新突破

    复旦大学研究团队开发了MOVE数据集和DMA算法,让AI系统能够像人类一样根据动作模式而非外观来理解视频内容。该系统包含224个动作类别和26万帧标注数据,通过解耦动作与外观特征,实现了突破性的视频分割效果。这项技术在视频编辑、体育分析、安防监控等领域具有广阔应用前景,代表了从静态识别向动态理解的重要技术进步。
    至顶网  科技行者  2025-08-05 10:36:22  
  • SCB 10X团队重磅突破:金融界的AI助手终于学会了专业推理

    SCB 10X团队开发了FinCoT方法,通过将金融专家推理流程嵌入AI提示中,显著提升了大语言模型在金融任务上的表现。该方法在CFA考试题目上将准确率从63.2%提升至80.5%,同时将输出长度减少8倍,为AI在专业金融领域的应用提供了新思路。
    至顶网  科技行者  2025-06-27 10:26:26  
  • 告别繁琐优化:东卡罗来纳大学团队让3D高斯点云风格转换变得像变魔术一样简单

    东卡罗来纳大学研究团队开发出一种革命性的3D高斯点云风格转换技术,无需重建或优化即可将任意风格应用到3D场景。通过构建表面图形网络,该方法将2D风格转换技术巧妙移植到3D空间,处理速度从传统的20分钟到3小时缩短至1-2分钟,且可在普通消费级硬件运行,为3D内容创作带来前所未有的便利性。
    至顶网  科技行者  2025-08-15 08:50:01  
  • 守护风雨中的古建筑:一手遥控,数条航线,一个伟大的梦

    拯救正在消失的人类文明。
    至顶网  黄当当  2021-11-24 10:36:59  
  • 香港大学团队突破AI文生图技术瓶颈:让机器真正"看懂"你说的话

    这项研究解决了AI文生图技术中文字描述与图像生成不匹配的核心问题。通过开发TACA方法,研究团队发现并修复了现有系统中注意力机制的两个关键缺陷:跨模态注意力抑制和时间不敏感性。实验显示该方法能显著提升模型的空间关系理解能力和属性绑定准确性,为AI创意工具的实用化发展提供了重要技术突破。
    至顶网  科技行者  2025-06-12 13:04:58  
  • 四步搞定图像编辑:清华和AIRI的循环一致性模型让修图变得又快又好

    清华和AIRI研究团队提出循环一致性图像编辑方法,仅需4步即可实现高质量图像编辑,速度比传统方法快10倍。该方法通过训练AI反复练习"看图-重画"过程提升图像理解能力,结合智能引导机制确保编辑质量,在多项评测中超越现有快速方法,为AI图像编辑的普及应用奠定基础。
    至顶网  科技行者  2025-06-30 11:21:52  
  • 1比特革命:微软发布首个开源原生1比特大语言模型 BitNet b1.58 2B4T

    微软研究院的研究团队近日发布了一项突破性成果——BitNet b1.58 2B4T,这是首个开源的、原生1比特大语言模型(LLM)。
    至顶网  科技行者  2025-04-18 16:37:56  
  • GPT-4o生成的合成图像让AI画画更聪明:上海AI实验室团队揭开数据质量的秘密

    本研究揭示了合成数据在AI图像生成训练中的独特价值,创建了18万张GPT-4o生成的Echo-4o-Image数据集。相比真实图像,合成图像能补充稀有幻想场景、提供纯净训练信号、实现精确的长尾属性控制。基于此数据集训练的Echo-4o模型在指令跟随、创意生成和多图融合任务上均实现显著提升,并展现出良好的跨模型迁移能力。
    至顶网  科技行者  2025-08-18 10:18:48  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号