用了 0.202166秒,为您找到mg 娱乐 公司 什么 網纸 YB233相关内容20327 条
  • Mistral AI首次推出推理模型Magistral:纯强化学习训练让AI学会"深度思考"

    Mistral AI首次推出推理模型Magistral,采用纯强化学习训练让AI学会深度思考。该模型在数学推理能力上提升近50%,能够展示完整思考过程,并意外获得多模态推理能力提升。研究团队开源了Magistral Small模型,为AI推理能力发展开辟新路径,证明了强化学习在培养AI思维能力方面的巨大潜力。
    至顶网  科技行者  2025-06-18 09:20:58  
  • Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI

    Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI
    至顶网  至顶AI实验室  2025-06-16 17:03:47  
  • 美团研究院打造超级GUI助手:让电脑和手机像人类一样"看懂"屏幕并自动操作

    美团研究团队推出突破性GUI操作AI系统UItron,能够像人类一样理解屏幕内容并自动执行复杂操作任务。该系统采用三段式训练方法,在多项标准测试中表现卓越,特别是在中文应用场景下达到54.1%的任务成功率,显著超越其他同类系统。研究团队收集了超过一百万步中文应用操作数据,为GUI代理在中文环境的实际应用奠定了基础。
    至顶网  科技行者  2025-09-05 10:13:57  
  • 德州农工大学最新突破:让电脑真正"看懂"人类在街头的一举一动

    德州农工大学等多所高校联合发布MMHU数据集,专门针对自动驾驶场景的人类行为理解。该数据集包含57,000个人类行为实例和173万视频帧,覆盖过马路、打电话、骑车等13种关键行为,并提供详细的文字描述和行为标注。实验显示,基于该数据集训练的模型在行为识别准确率上有显著提升,将推动自动驾驶系统更好理解人类行为和意图,提升道路安全。
    至顶网  科技行者  2025-07-23 09:14:50  
  • Meta发布Llama3.1,OpenAI推出AI搜索SearchGPT,Deepmind获得奥数银牌,这就是这周的AI大新闻。

    Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。
    至顶网  数字生命卡兹克  2024-07-30 13:04:30  
  • Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件

    Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
    至顶网  科技行者  2025-05-23 07:40:18  
  • Meta发布J1:通过强化学习激励LLM思考和做出更好的判断

    这篇研究介绍了Meta公司开发的J1系统,这是一种通过强化学习训练大语言模型进行评判的创新方法。J1将可验证和不可验证的提示转换为具有可验证奖励的判断任务,从而鼓励模型在做出决策前先进行思考。研究表明,J1在8B和70B参数规模下都超越了同等规模的现有模型,甚至在某些测试中超过了更大的模型如o1-mini和DeepSeek-R1。这种方法的核心创新在于不仅优化最终判断,还优化思考过程本身,使模型学会制定评估标准、生成参考答案并重新评估回答的正确性。
    至顶网  Hugging Face  2025-05-16 17:09:21  
  • 滑铁卢大学科学家发明神奇AI:仅凭声音就能生成开口说话的逼真视频

    这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景,将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战,但其突破性创新为未来视频内容创作开辟了全新路径。
    至顶网  科技行者  2025-08-27 10:31:20  
  • Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破

    Google DeepMind发布Gemma 3多模态AI模型家族,参数量从1B到27B,支持文字、图片理解和多语言处理,可在普通设备运行。创新的5:1注意力架构将内存消耗降低75%,支持128K长文档处理。在多项测试中表现优异,27B版本在聊天机器人竞技场排名第9,超越了许多更大规模的模型,实现了AI技术的真正民主化。
    至顶网  科技行者  2025-08-01 10:13:44  
  • 800个书呆子(Nerd),如何在邮轮上办一场亚文化的趴体?

    这是我跟“书呆子”们共度的一段旅程,这场游轮探险不只是对极客文化的致敬,更是对经典社会等级的彻底颠覆。
    至顶网  海外来电  2022-12-11 16:24:48  
  • 韩国KAIST团队首次解决文字图像修复难题,让老照片上的模糊文字重获新生

    韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含10万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识别的协同工作。实验显示该技术在文字识别准确率上比传统方法提升15-20%,为历史文献保护、档案数字化等领域提供了重要解决方案。
    至顶网  科技行者  2025-06-17 13:13:40  
  • 苹果研究院首创AI音频技术:让声音拥有记忆力,语音助手即将迎来智能化革命

    苹果公司研究团队开发出革命性语音AI技术RealTimeVoice,首次实现语音助手的完美记忆力和实时对话能力。该技术通过流式音频处理和创新的记忆缓存机制,让AI能够记住完整对话历史的同时保持快速响应,反应速度比传统系统提升一倍。这项突破将彻底改变人机语音交互体验,让数字助手真正成为理解用户的智能伙伴。
    至顶网  科技行者  2025-08-20 18:04:48  
  • 《数字经济洞察周报》2023年第18期 |全球生成式AI产业图谱及报告在第七届世界智能大会发布

    第七届世界智能大会成功召开,全球生成式AI产业图谱及报告发布。
    至顶网  孙硕,吕敬儒  2023-05-26 17:10:33  
  • StepFun团队发布NextStep-1:让机器像人类一样逐步生成图像的新突破

    StepFun团队发布的NextStep-1代表了AI图像生成领域的重要突破,采用自回归方式逐步生成图像,像艺术家作画般一点点构建视觉内容。这个14B参数的模型在多项测试中表现优异,不仅能高质量生成图像,还具备强大的编辑能力,为AI创作工具的发展开辟了新方向。
    至顶网  科技行者  2025-08-19 10:19:29  
  • 性能炸裂 深度评测RTX 3080新卡皇

    看看在实际测试中GeForce RTX 3080的表现。
    至顶网  风望月  2020-09-17 17:39:49  
  • 人工智能终于学会说话了?阿里巴巴等机构突破语音理解技术壁垒!

    阿里巴巴等机构联合发布LLaSO框架,这是首个完全开放的端到端语音理解系统。该框架包含2550万训练样本、20种语音任务,支持多模态交互,在标准化评估中获得0.72分,超越同类系统。LLaSO不仅提供完整数据和代码,还建立了统一评估标准,为语音AI研究提供了重要基础设施,推动了从语音识别向全面语音理解的技术跃升。
    至顶网  科技行者  2025-08-29 09:32:22  
  • SAE-Tuning:南加州大学团队让AI推理能力像积木一样灵活组装

    南加州大学研究团队开发了革命性的SAE-Tuning技术,能够像"移植手术"一样将AI推理能力从一个模型转移到另一个模型。该方法将传统推理训练的成本从数千美元降至约1美元,时间从数百小时缩短至20分钟,效果却毫不逊色。更令人惊讶的是,这种推理能力具有跨领域通用性和模块化特性,可以像插件一样即插即用,为AI能力的民主化和模块化发展开辟了新道路。
    至顶网  科技行者  2025-06-18 09:53:08  
  • 像人类需要疫苗一样,AI模型也需要"免疫":Vector研究所提出模型免疫方法对抗虚假信息

    这项由加拿大Vector研究所领导的研究提出了"模型免疫"概念,通过让AI模型在训练过程中接触已标记的虚假信息,增强其辨别和拒绝类似虚假内容的能力。类比人类疫苗接种原理,研究者在微调阶段向模型注入约5-10%的已标记错误内容作为"疫苗"。初步实验表明,免疫后的模型处理虚假信息的能力从60%提升至78%,同时保持了常规任务性能。研究团队还设计了严格的伦理与治理框架,确保虚假内容使用安全。这一方法为提高AI系统的事实准确性提供了预防性解决方案。
    至顶网  科技行者  2025-06-02 12:17:13  
  • 天津大学团队让AI生成动作快如闪电:MotionFlux让虚拟角色动起来只需毫秒

    天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
    至顶网  科技行者  2025-09-03 14:09:55  
  • 微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量

    微软发布Phi-4-Mini多模态语言模型,仅3.8亿参数却能媲美两倍规模模型性能。该模型采用创新"混合LoRA"技术,支持文本、图像、语音多模态输入,在数学推理、编程、语音识别等任务中表现出色,在OpenASR榜单排名第一。这种"小而精"设计理念为AI普及化提供新思路,使强大AI功能可在消费级设备运行。
    至顶网  科技行者  2025-08-04 10:00:34  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号