用了 0.066260秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容5680 条
  • 华为发布Pangu Pro MoE:全球首个72B参数稀疏语言模型,专为昇腾NPU优化设计

    华为昇腾团队发布了Pangu Pro MoE,这是全球首个采用混合分组专家(MoGE)架构的72B参数稀疏语言模型。该模型专为昇腾NPU优化设计,通过创新的专家分组策略解决了传统MoE模型的负载不均衡问题,实现了完美的计算负载分配。模型仅激活16B参数处理每个token,在推理效率上显著超越同规模密集模型,为大规模AI应用提供了高效解决方案。
    至顶网  科技行者  2025-07-02 09:08:44  
  • YuE:能创作五分钟完整歌曲的AI音乐家诞生了,香港科技大学开发的开源音乐生成模型震撼发布

    香港科技大学研究团队开发出首个开源长篇音乐生成模型YuE,能根据歌词创作5分钟完整歌曲。该系统采用双阶段架构和轨道解耦技术,在人工评估中与商业系统性能相当,支持多语言创作和风格转换,为音乐创作民主化奠定基础。
    至顶网  科技行者  2025-08-01 10:17:46  
  • AI"学霸"LoRA的记忆难题:AIRI团队揭秘知识注入的隐藏代价

    这项由俄罗斯AIRI研究所等多家机构联合完成的研究,首次系统揭示了LoRA技术在AI知识注入中的潜在风险。通过对Llama-3.1模型的大规模实验,研究团队发现AI在学习新知识时存在明显的"安全阈值",超过500个新事实后性能显著下降。更重要的是,他们发现释义增强策略能有效缓解这些问题,为AI安全知识更新提供了重要指导。
    至顶网  科技行者  2025-08-25 12:29:57  
  • AI路由器的革新:让机器根据你的喜好来选择最适合的AI大模型

    Katanemo Labs公司研究团队开发了Arch-Router,一个15亿参数的AI路由器,能根据用户偏好智能选择最合适的AI模型。该系统采用"领域-动作"分类框架,在多项测试中超越GPT-4等大型模型7.71%,响应速度快28倍。研究证明了专业化小模型在特定任务上可超越通用大模型,为AI行业发展指出新方向。
    至顶网  科技行者  2025-07-01 09:55:04  
  • 上海AI实验室的新突破:让你用键盘控制的虚拟世界探险家YUME

    上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
    至顶网  科技行者  2025-07-28 15:33:14  
  • JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字

    新加坡科技设计大学研究团队开发了JAM音乐生成系统,能够根据歌词生成完整歌曲,并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统,在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制,JAM为AI音乐创作提供了新的技术路径。
    至顶网  科技行者  2025-08-04 13:34:24  
  • 蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域

    这项由法国蒙彼利埃大学团队开发的iFAM系统,通过创新的两阶段设计解决了AI视觉模型"看错重点"的问题。系统第一阶段识别图像中的关键区域,第二阶段只处理被选中的区域,完全屏蔽背景干扰。在多个挑战性数据集上的实验表明,该方法显著提升了模型对虚假关联的抗性,为医疗诊断、自动驾驶等高风险应用提供了更可靠的技术基础。
    至顶网  科技行者  2025-06-19 10:47:20  
  • FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

    香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
    至顶网  科技行者  2025-06-11 07:48:46  
  • Iwin Transformer:上海交通大学提出的无位置编码视觉变换器,让AI看图更聪明

    上海交通大学研究团队提出Iwin Transformer,这是一种无位置编码的分层视觉变换器,通过创新的交错窗口注意力和深度可分离卷积协作,能直接从低分辨率微调到高分辨率。该方法用注意力连接远程令牌,用卷积连接邻近令牌,在单模块内实现全局信息交换,克服了Swin Transformer需要两个连续块的局限。在ImageNet-1K上达到87.4%准确率,在语义分割和视频识别等任务中表现出色。
    至顶网  科技行者  2025-07-29 17:16:23  
  • 从OpenAI出走,到成为AI独角兽:Anthropic诞生的完整故事,以及5条“经验之谈”

    本文讲述了几个创始人从OpenAI出走,带着一套“AI必须讲道德”的理念,创立了Anthropic这家公司,并培养了(他们说的)“AI界最正直的公民”Claude。
    至顶网  周雅  2025-04-09 21:37:28  
  • SCB集团团队突破传统RAG技术壁垒:打造超大规模网络知识库的高速检索新方案

    泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
    至顶网  科技行者  2025-06-20 14:18:38  
  • 复杂场景下的AI视觉难题:清华、牛津联合发布史上最困难的视频分割挑战MOSEv2

    复旦大学联合牛津大学等机构发布MOSEv2数据集,这是目前最具挑战性的视频目标分割基准。数据集包含5024个复杂场景视频,涵盖恶劣天气、密集人群、目标消失重现等真实世界挑战。测试结果显示,包括SAM2在内的先进AI模型性能大幅下降,从理想数据集的90%+准确率降至50%左右,揭示了AI技术与实际应用需求的巨大差距。
    至顶网  科技行者  2025-08-12 14:15:25  
  • 特拉维夫大学重大突破:让AI"大脑"变得透明可读的新方法

    这项由特拉维夫大学研究团队完成的突破性研究,开发出一种新方法来解析AI大脑的内部结构。通过半非负矩阵分解技术,研究人员成功识别出AI中负责不同概念的"知识组件",并发现这些组件呈现层次化组织结构。实验证明,这种方法不仅能准确检测概念,还能有效操控AI行为,为理解和控制AI系统提供了新的工具。
    至顶网  科技行者  2025-06-18 17:44:29  
  • 万字指南 | 当SaaS出海“回到”美国,那些共识与非共识背后的观察与思考

    以美国为主的北美市场通常是软件及科技创业者迈向全球的第一步,这里不仅诞生了许多具备产品创新和技术特色的 SaaS 及软件公司,而且在生成式 AI 从硅谷席卷全球的这两年,软件产业也最先被“渗透”,甚至最近有人大呼:“AI 已来,SaaS 将死?”
    至顶网  Linkloud  2024-10-17 14:04:30  
  • NVIDIA发布Cosmos-Reason1:让AI拥有物理常识和身体推理能力的突破性研究

    NVIDIA团队开发的Cosmos-Reason1是首个专门针对物理推理的多模态AI系统,通过创新的训练方法让AI具备了理解物理世界和进行具身推理的能力。该系统包含70亿和560亿参数两个版本,采用物理AI监督微调和强化学习两阶段训练,在物理常识和具身推理评测中显著超越现有模型,为机器人、自动驾驶等应用奠定重要技术基础。
    至顶网  科技行者  2025-07-31 11:28:01  
  • 新加坡大学团队打造"影音同步魔法师":让机器像导演一样拍出声画完美合一的视频

    新加坡国立大学团队突破音视频同步生成技术难题,开发出JavisDiT系统,能像专业导演一样确保声画完美同步。该系统采用创新的双向交叉注意力机制和分层时空先验估计器,在包含10,140个复杂场景样本的JavisBench数据集上全面超越现有方法,为音视频内容创作开辟新可能。
    至顶网  科技行者  2025-07-15 11:36:57  
  • 蒙特利尔大学团队用AI"强化学习"让图像编辑变得像聊天一样简单

    蒙特利尔大学研究团队开发出EARL图像编辑系统,通过强化学习训练让AI能够理解自然语言指令并完成复杂图像编辑。该系统采用"教练式"训练方法,AI在智能评价系统指导下持续改进编辑能力,最终在综合测试中以4.80分超越了包括商业系统Omnigen在内的所有对比方法。EARL不仅能处理简单的颜色修改,还能完成空间关系调整、数量变化等复杂任务,代表了人机交互方式的重要变革,有望让图像编辑变得像聊天一样简单。
    至顶网  科技行者  2025-08-11 09:57:30  
  • AI奖励模型也能"临时抱佛脚"?DeepSeek团队发现让AI在推理时多动脑筋,效果竟比增加训练数据更好

    DeepSeek团队联合清华大学开发了一种革命性的AI评判方法——自主原则批评调优(SPCT),该方法让AI在推理时"多动脑筋",通过制定评判原则并进行多角度分析来提升评判准确性。研究发现,这种"慢思考"方式的效果竟然比简单增加模型规模更好,在多个评测基准上都取得了显著性能提升,为AI发展提供了新的技术路径。
    至顶网  科技行者  2025-07-15 11:35:24  
  • 上海交通大学发布突破性科学推理数据集:让AI像人类一样思考科学问题

    上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
    至顶网  科技行者  2025-07-27 12:11:47  
  • 当AI成为隐私保护神:德州大学团队让大语言模型变身个人信息清理专家

    德州大学研究团队开发的PRvL系统成功将大语言模型应用于个人信息保护,实现了99.4%的识别准确率和极低的隐私泄露风险。该系统支持多种模型架构和训练策略,具备跨语言处理能力,完全开源可本地部署,为医疗、法律、金融等敏感领域提供了实用的隐私保护解决方案。
    至顶网  科技行者  2025-08-12 14:17:00  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号