用了 0.127919秒,为您找到澳洲 幸运 10 怎么 才能 網纸 YB233相关内容13801 条
  • 哈工大团队打造会玩Minecraft的全能AI管家:从规划到行动样样精通

    哈尔滨工业大学团队开发的Optimus-3是首个在Minecraft环境中具备完整认知能力的AI系统,能够同时处理感知、规划、行动、定位和反思五大任务。该系统采用专家混合架构和任务级路由机制,有效解决了多任务学习中的干扰问题,并通过多模态推理增强强化学习显著提升了视觉相关任务的表现。实验结果显示,Optimus-3在各项任务上均超越了现有最先进系统,为通用人工智能的发展提供了重要技术路径。
    至顶网  科技行者  2025-06-17 15:23:51  
  • 北漂换过四十份工作,30岁她远走非洲,找到自己安栖之地

    “小城市的人不理解我,嘲笑我是‘大粪厂长‘,但我大城市的朋友们不一样,他们说如果你能把屎卖出去,那很厉害。”
    至顶网  尼酱  2023-07-18 15:08:09  
  • 微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语

    沙特阿拉伯misraj.ai团队开发了Kuwain 1.5B,一个仅15亿参数的阿拉伯语-英语双语AI模型。他们创新性地提出"语言注射"技术,在英语模型基础上增加8个新层专门处理阿拉伯语,同时保持原有层冻结。通过扩展26000个阿拉伯语词汇和9:1的数据配比,实现了阿拉伯语性能8%提升,英语能力完全保持,训练成本降低70%。该方法可推广到其他语言,为多语言AI发展提供了高效经济的新路径。
    至顶网  科技行者  2025-07-17 09:27:01  
  • 让AI看懂视频因果关系:女王大学突破视频推理技术壁垒

    加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
    至顶网  科技行者  2025-07-09 15:45:45  
  • 香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片

    香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段,大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法,为动画产业的智能化发展开辟新路径。
    至顶网  科技行者  2025-08-19 10:46:28  
  • 人工智能与深度学习技术16大回顾,承包你一年的知识点

    激动人心的2017年已结束,博客WildML的作者、曾在Google Brain做了一年Resident的Denny Britz,就分享出这一年他对AI和深度学习领域重点事件的回顾与梳理。可以说,这16个要点,能在让你在人工智能圈子里装逼一年不落伍!
    至顶网  CNET科技行者  2018-01-05 10:16:05  
  • 复旦大学团队突破多模态AI理解瓶颈:让机器像人一样"看懂"图片不再靠猜测

    复旦大学等机构联合提出ASVR方法,通过自回归语义视觉重构解决大型视觉语言模型过度依赖文字监督的问题。该方法让AI同时学习视觉和文本信息,在14个多模态理解基准上平均提升5个百分点。研究发现语义重构比像素重构更有效,且方法在不同架构、数据规模和分辨率下均表现稳健,为AI视觉理解能力提供了新的技术路径。
    至顶网  科技行者  2025-06-16 10:57:34  
  • Kwai快手推出Keye-VL模型:让AI真正看懂短视频的突破性技术

    快手推出的Keye-VL是一个专门为短视频理解而设计的80亿参数AI模型,在视频内容理解、数学推理和多模态任务方面达到同类模型中的最高水平。该模型采用独创的五模式推理系统和四阶段训练策略,能自动判断任务难度并选择合适的思考方式,在快手自建的KC-MMBench短视频基准测试中大幅领先其他模型。
    至顶网  科技行者  2025-07-04 17:19:51  
  • 多台无人机不用对话也能抬重物?代尔夫特理工大学用AI让空中搬运变得聪明又安全

    代尔夫特理工大学研究团队首次实现了完全分布式的多无人机协作搬运系统,通过多智能体强化学习让三台无人机在无需相互通信的情况下精确控制悬挂重物的6自由度姿态。该方法仅通过观察被搬运物体状态实现隐性协作,计算效率比传统集中式方法提升13倍,并展现出优异的容错能力。
    至顶网  科技行者  2025-08-18 13:57:29  
  • ASM-UNet:让医疗影像识别系统拥有"火眼金睛",清华大学团队攻克精细结构分割难题

    清华大学团队开发的ASM-UNet系统通过创新的自适应扫描机制,首次实现了医疗影像精细结构的智能识别。该系统结合群体共性和个体差异的双重评分策略,在胆管系统等微小复杂结构分割上取得突破性进展。团队还构建了BTMS数据集,为精细粒度医疗影像分割提供标准测试平台,推动精准医疗发展。
    至顶网  科技行者  2025-08-18 13:58:52  
  • 微软开发的14B参数AI:用510步训练就能媲美6710亿参数模型的数学推理能力

    微软研究院开发的rStar2-Agent是一个仅140亿参数的AI数学推理模型,通过创新的智能体强化学习方法,在AIME24数学竞赛中达到80.6%准确率,超越了6710亿参数的DeepSeek-R1等大型模型。该模型的核心创新包括GRPO-RoC算法、分布式代码执行环境和渐进式训练策略,仅用510个训练步骤和一周时间就达到顶级性能,展示了"小模型大能力"的技术路径,为AI发展提供了高效替代方案。
    至顶网  科技行者  2025-09-04 09:59:30  
  • 宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"

    宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。
    至顶网  科技行者  2025-09-02 16:03:37  
  • 创业者涌入AI战场,最先利用AI大模型赚到钱的人

    AIGC淘金人。
    至顶网  吴彤  2024-07-18 14:40:10  
  • 华为团队重大突破:让AI直接理解数学题并给出严格证明,就像有了一个永不出错的数学助手

    华为诺亚方舟实验室联合香港中文大学团队在2025年6月首次实现了从自然语言数学问题到严格证明的端到端自动化处理。他们开发的Mathesis系统包含创新的强化学习自动形式化器、精细化评估框架LeanScorer,以及高性能证明器,在中国高考数学测试集上达到18%成功率,相比最佳基线提升22%。该系统已集成到华为Celia智能助手中,将数学问题解决准确率从65.3%提升至84.2%,展现了AI数学推理的巨大应用潜力。
    至顶网  科技行者  2025-06-16 09:57:21  
  • 专家发现AI图像生成模型的"记忆删除"其实是假象:CISPA等机构揭示文生图模型记忆机制真相

    德国研究机构发现AI图像生成模型的记忆删除技术存在严重缺陷,现有权重修剪方法只是表面隐藏记忆而非真正删除。研究团队开发的Dori技术能够绕过这些防护措施,重新激活看似已被遗忘的训练数据。他们提出的对抗性微调解决方案通过重塑AI整体行为模式实现更可靠的记忆消除,为AI安全和版权保护提供了新思路。
    至顶网  科技行者  2025-07-28 15:32:28  
  • ServiceNow联合Mila等机构提出全新视觉-文本桥接神器,让AI看懂图片中的文字真的不再困难

    ServiceNow联合多个顶级研究机构提出ALIGNVLM,这是一个专门用于文档理解的视觉-语言模型。其核心创新ALIGN连接器通过将视觉特征映射为语言模型词汇的概率分布,有效解决了传统方法中视觉和语言模态对齐不准确的问题,在多个文档理解基准测试中取得显著性能提升。
    至顶网  科技行者  2025-08-21 10:01:25  
  • 上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"

    上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出惊人的跨学科推理能力,在物理、化学、生物等领域都有优异表现,性能接近OpenAI的o1模型。研究团队将所有成果完全开源,为AI研究社区提供了宝贵资源。
    至顶网  科技行者  2025-08-01 10:15:26  
  • 南洋理工大学重磅突破:让AI同时"造梦"第一视角视频和人体动作

    新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。
    至顶网  科技行者  2025-08-29 14:08:39  
  • 阿里巴巴推出ThinkSound:让AI像音效师一样"思考"创造声音

    阿里巴巴联合香港科技大学和浙江大学开发的ThinkSound系统,通过引入思维链推理让AI学会像专业音效师一样思考和创作。该系统采用三步式交互流程,支持基础音景生成、物体定制和语言编辑,在多项评测中表现优异,有望降低音效制作门槛并提升创作效率。
    至顶网  科技行者  2025-07-02 11:24:54  
  • 网易有道团队发布Confucius3-Math:让消费级GPU也能跑出顶级数学推理能力的14B参数模型

    网易有道研究团队开发了Confucius3-Math,这是一个专门针对中国K-12数学教育的14B参数AI模型。该模型在多项数学推理测试中表现出色,超越了许多规模更大的竞争对手,训练成本仅需2.6万美元,推理速度比DeepSeek-R1快15倍,能在消费级GPU上高效运行,旨在通过降低AI教育成本来促进教育公平。
    至顶网  科技行者  2025-07-02 09:09:50  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号