用了 0.024154秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容1545 条
  • FuriosaAI团队革命性突破:小模型当参谋,大模型省内存,让AI推理又快又准!

    FuriosaAI团队提出突破性的Draft-based Approximate Inference框架,通过小模型预测指导大模型智能管理资源。研究开发了SpecKV和SpecPC两种方法,分别用于KV缓存管理和文本压缩,在保持高准确性的同时显著降低内存使用和计算延迟,为长文本AI推理提供了高效可行的解决方案。
    至顶网  科技行者  2025-06-17 12:35:30  
  • 从呼噜声到语法:探索如何在合作觅食中产生语言 - A*STAR与南洋理工研究团队的突破性发现

    这项由新加坡和英国研究机构联合进行的研究,使用多智能体强化学习探索了语言起源问题。研究团队设计了"觅食游戏"环境,让智能体在部分可观察的世界中协作完成任务。结果表明,智能体自发发展出具有人类语言五大特性的通信系统:任意性、互换性、位移性、文化传播和组合性。研究提供了关于语言如何在合作环境中自然演化的新见解,证明语言是从社会互动和共享目标中浮现的工具,而非孤立系统。
    至顶网  科技行者  2025-05-23 07:42:55  
  • CSVQA:中国团队打造超全面科学测评基准,挑战视觉语言模型的STEM推理能力

    这篇研究介绍了CSVQA,一个专为评估视觉语言模型在STEM领域推理能力的中文多模态基准测试。该数据集包含1,378道涵盖物理、化学、生物和数学的问题,每题都要求模型分析科学图表并进行专业推理。实验评估了15种VLM,结果显示即使最强大的模型o1也仅达到49.6%的准确率,揭示了当前AI在科学推理方面的明显局限。研究还发现模型在不同学科表现不一,思维链提示效果因模型而异,为未来改进指明了方向。
    至顶网  科技行者  2025-06-07 08:28:47  
  • AI推理模型真的像宣传的那样聪明吗?Anthropic和Open Philanthropy研究人员揭露评测陷阱

    Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
    至顶网  科技行者  2025-06-18 17:44:59  
  • 实现多LLM融合的动态选择框架:东北大学等机构突破大模型知识聚合的局限性

    这项研究由东北大学、北京大学、哈佛大学和谷歌合作完成,提出了一种名为Fusion-X的创新框架,用于解决大语言模型知识聚合中的挑战。研究团队通过引入自适应选择网络、动态加权融合策略和反馈驱动损失函数,实现了多个异构LLM的高效集成,在不增加模型规模的情况下显著提升了性能,同时将知识干扰减少高达50%。实验结果表明,该方法在常识、推理和代码生成等多项任务上均优于现有方法,为LLM融合技术开辟了新方向。
    至顶网  科技行者  2025-06-04 12:57:04  
  • 追求极致性能的巅峰对决 阿里云 vs AWS

    为了对阿里云神龙服务器实际性能进行更深入地了解。下面我们就从基础性能、应用性能、大数据性能以及行业应用场景四个方面对阿里云神龙服务器与和它技术发展路线相近的AWS Nitro服务器进行一下测试。看看由千变万化的神龙,是否依然具备着裸金属的性能实力。
    至顶网  董培欣  2021-10-21 12:42:27  
  • SuperWriter:使用大型语言模型实现反思驱动的长篇文本生成

    SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
    至顶网  科技行者  2025-06-08 09:32:16  
  • Mergenetic:一款简单易用的进化式模型合并工具库|让普通GPU也能创造顶尖语言模型

    Mergenetic是一个开源工具库,让研究人员能在普通GPU上进行进化式模型合并。由罗马萨皮恩扎大学和洛桑联邦理工学院研究者开发,它集成了19种进化算法和6种合并策略,支持数据集抽样以减少计算负担,并提供Python API、命令行和图形界面三种交互方式。通过案例研究证明,该工具能有效合并多语言模型和促进跨语言能力迁移,降低了高质量模型合并的技术门槛,使普通研究者也能创造出优秀的语言模型。
    至顶网  科技行者  2025-05-21 14:11:16  
  • 国网黑龙江电力ERP“上云” 看青云QingCloud全维云赋能行业数字化转型

    在全新架构之下,青云QingCloud联手合作伙伴,为黑龙江电力提供一整套完善的ERP迁移与测试方案,顺利帮助黑龙江电力实现了ERP“上云”。
    至顶网  李祥敬  2020-03-06 17:27:21  
  • 思科Talos:VPNFilter更新——VPNFilter攻击终端并瞄准新设备

    思科 Talos 与多家情报合作伙伴共同发现了有关 “VPNFilter” 的更多详细信息。在我们最初发布活动调查结果的几天里,我们已发现 VPNFilter 所瞄准的设备品牌/型号比最初想象得更多,而且还具有其他的功能,例如向终端进行攻击的能力。
    至顶网  业界供稿  2018-06-08 16:17:59  
  • 英特尔多维发力,推动人工智能规模化发展

    英特尔亚洲人工智能销售技术总监伊红卫也表示,在加速人工智能行业落地的过程中,英特尔可以从硬件、软件和生态三个方面进行赋能。
    至顶网  李祥敬  2019-11-29 15:58:21  
  • SophiaVL-R1:为多模态大语言模型注入思维奖励,让AI推理能力更上一层楼

    SophiaVL-R1是香港中文大学和上海人工智能实验室联合开发的多模态大语言模型,创新性地引入了"思维奖励"机制来提升AI的推理能力。与传统方法不同,该研究不仅关注AI是否得出正确答案,还评估整个思考过程的质量,通过Trust-GRPO算法智能地整合思维奖励和结果奖励。实验表明,即使只有7B参数,SophiaVL-R1也能在MathVista、MMMU等多个基准测试中超越参数量大10倍的模型,证明了思维过程监督对提升AI泛化推理能力的重要价值。
    至顶网  科技行者  2025-05-28 08:09:15  
  • 深度揭秘:算力创新竞技的拓荒者

    在浪潮信息,有这样一群工程师们,他们在好奇心的驱动下,通过各种方式寻找算力提升的路径,无论进步大小,自豪感都在驱使着他们继续探索未知,甚至像一个科学家一样琢磨各种跨界的技术,并用于解决各类工程难题。
    至顶网  业界供稿  2023-10-25 15:17:17  
  • 华为胡厚崑:疫情“关上了门”,创新“打开了窗”

    在2021年世界移动大会·上海开幕式上,华为副董事长胡厚崑发表了《创新,点亮未来》的主题演讲。面对疫情给国家、地区、企业和个人带来的重大的影响,技术创新帮助全社会更好地应对了疫情冲击。
    至顶网  至顶网大数据频道  2021-02-23 14:34:40  
  • SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术

    SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
    至顶网  科技行者  2025-06-06 09:18:07  
  • 打破界限:KAIST研究团队用SMILES解析器提升大语言模型对化学分子的理解能力

    KAIST研究团队开发了CLEANMOL框架,解决了大语言模型理解SMILES分子表示法的关键难题。传统模型即使在简单任务如计数分子环数时也表现不佳,因为SMILES编码中结构信息常呈非连续分布。研究通过设计官能团匹配、环计数等确定性任务,大大提升了模型对分子结构的理解。实验表明,预训练后的模型在逆合成等下游任务上表现优异,精确匹配率从45.6%提升至58.1%。这一突破无需昂贵实验数据,为药物开发和材料设计提供了低成本高效的AI支持方案。
    至顶网  科技行者  2025-05-30 15:07:48  
  • 任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话

    任正非在中央研究院创新先锋座谈会上与部分科学家、专家、实习生的讲话,认为还是要和大家勇敢地沟通,一起前进,战胜困难,我们要敢于走在时代前沿。
    至顶网  至顶网数字化转型频道  2021-09-14 22:08:40  
  • CPGD:让语言模型的规则强化学习更稳定可靠

    这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果表明,CPGD在多个多模态数学基准测试上显著优于其他强化学习算法,与基础模型相比平均提升11.0%的性能,尤其在领域内测试上提升21.8%,展现出卓越的稳定性和泛化能力。
    至顶网  科技行者  2025-05-22 08:26:13  
  • GTC China 2018:NVIDIA宣布多方位AI产品布局

    2018年11月21日,NVIDIA在苏州举办了GTC China大会。大会上,NVIDIA创始人兼首席执行官黄仁勋在两个多小时的主题演讲中为我们分享了NVIDIA对于AI时代的思考以及众多新产品、新技术和新服务。
    至顶网  业界供稿  2018-11-26 11:07:16  
  • ReasonGen-R1:微软使用监督微调与强化学习让图像生成模型先思考后创作

    这篇研究论文介绍了ReasonGen-R1,一个由微软与上海科技大学合作开发的创新框架,首次将链式思考(CoT)与强化学习(RL)应用到自回归图像生成模型中。研究通过两阶段方法实现:先用监督微调(SFT)教会模型生成推理文本,再用群组相对策略优化(GRPO)提升生成质量。实验证明该方法在GenEval(+6%)、DPG-Bench(+1.69%)和T2I基准测试(+13.38%)上均优于现有模型,证实"先思考后创作"的方法能显著提高AI图像生成的指令遵循能力和质量。
    至顶网  科技行者  2025-06-05 10:20:28  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号