用了 0.032381秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容2143 条
  • 韩国成均馆大学让AI"忘掉"敏感数据的可视化新工具:机器遗忘技术的透明评估系统

    韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator,解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法,并基于分析洞察开发出性能优异的引导遗忘新方法,为构建更负责任的AI系统提供重要工具支持。
    至顶网  科技行者  2025-09-09 10:56:07  
  • CPGD:让语言模型的规则强化学习更稳定可靠

    这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果表明,CPGD在多个多模态数学基准测试上显著优于其他强化学习算法,与基础模型相比平均提升11.0%的性能,尤其在领域内测试上提升21.8%,展现出卓越的稳定性和泛化能力。
    至顶网  科技行者  2025-05-22 08:26:13  
  • GTC China 2018:NVIDIA宣布多方位AI产品布局

    2018年11月21日,NVIDIA在苏州举办了GTC China大会。大会上,NVIDIA创始人兼首席执行官黄仁勋在两个多小时的主题演讲中为我们分享了NVIDIA对于AI时代的思考以及众多新产品、新技术和新服务。
    至顶网  业界供稿  2018-11-26 11:07:16  
  • 当你说话时,AI是如何学会7种语言的精准表达:Cohere Labs团队的多语言推理突破

    Cohere Labs研究团队提出了一种革命性的多语言AI优化方法,无需重新训练模型即可显著提升非英语语言的表现。通过"多重采样+智能选择"策略,让AI生成多个候选答案后选出最优回应。实验显示该方法让8B参数小模型在多语言任务上挑战大型商业模型,平均性能提升6.8-17.3个百分点,为AI多语言应用开辟了高效可行的新路径。
    至顶网  科技行者  2025-06-30 10:55:40  
  • ReasonGen-R1:微软使用监督微调与强化学习让图像生成模型先思考后创作

    这篇研究论文介绍了ReasonGen-R1,一个由微软与上海科技大学合作开发的创新框架,首次将链式思考(CoT)与强化学习(RL)应用到自回归图像生成模型中。研究通过两阶段方法实现:先用监督微调(SFT)教会模型生成推理文本,再用群组相对策略优化(GRPO)提升生成质量。实验证明该方法在GenEval(+6%)、DPG-Bench(+1.69%)和T2I基准测试(+13.38%)上均优于现有模型,证实"先思考后创作"的方法能显著提高AI图像生成的指令遵循能力和质量。
    至顶网  科技行者  2025-06-05 10:20:28  
  • 当心安全漏洞!韩国中央大学研究团队揭示大语言模型在遵守安全政策时面临的严峻挑战

    韩国中央大学研究团队开发了名为CoPriva的基准测试,评估大语言模型遵守上下文安全策略的能力。研究发现,虽然多数模型能成功拒绝直接违反安全政策的查询,但在面对间接攻击时存在严重漏洞,泄露率平均增加40%以上。即使是推理能力强的模型也未显示出明显优势,且高忠实度的回答往往伴随更多信息泄露。研究团队评估了10种先进模型,发现政策存在与否对防止泄露影响有限,而修订功能仅能部分提升合规性。这揭示了当前AI安全对齐的重大缺陷,强调了开发更强健安全机制的紧迫性。
    至顶网  科技行者  2025-05-29 08:24:17  
  • 2024看得见的未来:数据中心行业十大发展趋势

    2023年,我们见证了人工智能(AI)的爆发,它正在改变人们的工作、生活、以及与技术交互的方式。
    至顶网  业界供稿  2024-01-29 10:09:58  
  • 大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍

    深圳大学、腾讯等机构联合提出ReDit方法,通过在离散奖励信号中添加随机噪音解决AI训练中的梯度不稳定问题。该方法将学习速度提升约10倍,在数学推理等任务上显著改善模型性能,为大语言模型训练提供了简洁高效的优化方案。
    至顶网  科技行者  2025-06-26 12:50:57  
  • 对话五家人形机器人团队:2023因何成了人形机器人盛世?

    2023年,人形机器人迎来了高光时刻。
    至顶网  金旺  2023-08-17 19:47:04  
  • 对话五家人形机器人团队:2023因何成了人形机器人盛世?

    2023年人形机器人的产业巨变和背后推动力。
    至顶网  金旺  2023-08-17 19:43:12  
  • 深潜大语言模型的"真空地带":不是所有层都在全力工作,偷懒的层竟然越过越好?

    这项研究揭示了大语言模型中存在"空域"——在推理过程中几乎不活跃的神经网络层。研究者开发了L2自适应计算方法,无需额外训练即可准确识别这些空域。惊人的是,在Qwen2.5-7B模型上,跳过70%的层后性能反而从69.24%提升到71.29%;Mistral-7B在GPQA测试中跳过约30%的层后,准确率提高了4.48%。这表明不同模型层的贡献极不均衡,有选择地跳过"懒惰层"不仅能保持性能,有时甚至能提升结果,为未来模型优化提供了新思路。
    至顶网  科技行者  2025-05-27 10:14:04  
  • 被智能手机淘汰的 11 项技术

    沿着这条「遗忘小径」走一走,看看那些曾经风靡一时、最终却被智能手机普及所淘汰的技术。
    至顶网  SlashGear  2022-11-24 11:50:08  
  • 5G路上,绕不开的毫米波

    5G要发展,频谱需先行。
    至顶网  周雅  2019-03-20 22:26:35  
  • 到2053年,电子产品会是什么样?

    你将在30年后的CES上看到什么?这篇文章帮你大胆猜测了一下。
    至顶网  WIRED  2024-01-05 10:40:48  
  • 解读亚马逊re:Invent首日,AWS CEO五十多次提及重塑 加速企业上云及数字创新

    今年的re:Invent上,Andy Jassy再次为全球40多万名注册观众带来长达三小时的主题演讲,并且一口气发布27项创新的云服务和功能(当天总共发布43项新服务和功能),令到场的媒体和分析师惊叹。
    至顶网  至顶网CIO与CTO频道  2020-12-07 10:02:47  
  • 马里兰大学推出DynaGuard:让AI守门员学会理解你的专属规则

    马里兰大学研究团队推出DynaGuard,这是首个能理解用户自定义规则的AI守护模型。不同于只能识别预设类别的传统系统,DynaGuard能处理自然语言编写的任何规则,并提供详细解释帮助AI自我纠正。该模型基于40000个场景的DynaBench数据集训练,在传统安全任务和定制规则处理上都表现优异,为AI安全技术开辟了新方向。
    至顶网  科技行者  2025-09-22 10:28:15  
  • 思科推出Silicon One G200 吹响进军InfiniBand的号角

    本周看到思科推出Silicon One G200 ASIC也走出了正确的一步,这些ASIC的设计从一开始就考虑了人工智能训练工作负载
    至顶网  至顶网网络与安全频道  2023-06-25 18:59:30  
  • 无需训练的视觉语言大模型推理与反思能力:武汉大学研究团队开创性FRANK模型让AI自我纠错

    武汉大学研究团队提出了FRANK模型,一种无需训练的方法,能让视觉语言大模型获得推理和反思能力。研究发现多模态模型中,浅层解码器负责视觉理解,深层负责文本推理,据此设计了一种层次化权重合并策略,将视觉模型与推理模型智能融合。他们通过泰勒展开推导出闭式融合权重公式,并引入注意力引导的指数衰减先验,使模型既保留视觉感知又获得推理能力。实验显示FRANK-38B在MMMU测试中达到69.2%准确率,超越GPT-4o,且展现出卓越的自我纠错能力,为多模态AI提供了无需昂贵训练的新途径。
    至顶网  科技行者  2025-05-28 07:37:57  
  • 哈佛和MIT科学家联手破解基因开关密码:让细胞听话的全新生物计算方法

    哈佛大学医学院Douglas Densmore教授团队联合MIT研究人员,将工程控制理论与生物学相结合,开发出精确控制基因调控回路的新方法。该研究发表于《Nature Communications》,通过数学建模框架实现了对细胞基因表达的精准调节,如同为细胞工厂设计智能调度系统。实验验证显示该方法具有高预测准确性和良好扩展性,为精准医疗、生物制药、环境治理等领域带来革命性应用前景。
    至顶网  科技行者  2025-08-26 10:17:56  
  • 腾讯研究团队首次从理论高度解密AI为何需要工具,背后竟隐藏着这样的数学原理

    腾讯和清华研究团队首次从数学理论角度解释了为什么AI需要外部工具。研究证明纯文本AI存在"隐形枷锁",无法突破预训练的能力边界,而工具集成能打破这种限制,让AI获得全新的问题解决策略。团队还开发了ASPO算法,解决了训练AI更早使用工具的技术难题。实验显示配备工具的AI在数学问题上全面超越纯文本版本,展现出三种新奇认知模式,为构建更强大的AI系统提供理论指导。
    至顶网  科技行者  2025-09-02 09:33:42  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号