用了 0.049249秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动

    南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四个复杂操作任务上成功率达70%,无需特定硬件训练即可在不同机器人上部署,为通用机器人操作技术发展开辟新路径。
    至顶网  科技行者  2025-06-10 14:21:54  
  • AI侦探诞生记:Allen Institute打造首个能追溯大模型"记忆"的神奇工具

    Allen Institute for AI推出首个能实时追溯大语言模型输出到万亿训练数据来源的系统OLMOTRACE。该系统通过创新的并行算法,可在几秒内找到AI回答中与训练数据完全匹配的文本片段,为AI行为分析开创了新范式。支持事实核查、创意溯源等应用,已在AI2 Playground开放使用。
    至顶网  科技行者  2025-07-16 09:58:01  
  • 人工智能学会自己分解组装3D物体:香港大学团队让计算机具备"零件思维"

    香港大学团队开发的OmniPart系统实现了AI领域的重要突破,让计算机首次具备了像人类一样的"零件思维"。该系统能从单张2D图片生成具有清晰零件结构的3D模型,用户可通过简单的颜色遮罩控制分解过程。系统采用两阶段设计:先进行结构规划预测零件位置,再同步生成所有零件。实验显示其性能显著优于现有方法,生成效率提升20倍,为3D内容创作、游戏开发、虚拟现实等领域开辟了新的可能性。
    至顶网  科技行者  2025-07-17 13:57:26  
  • 港科大联手快手:视频生成模型将彻底重塑游戏开发,每个人都能成为游戏设计师

    香港大学、香港科技大学与快手科技联合发布开创性研究,提出用交互式生成视频(IGV)技术构建下一代游戏引擎,将彻底改变游戏开发模式。该技术能实时生成无限游戏内容,让每个人都能成为游戏设计师,解决传统游戏内容有限、成本高昂、缺乏个性化等根本问题,为游戏产业描绘了一个充满想象力的未来。
    至顶网  科技行者  2025-08-01 10:17:00  
  • 只要256MB就能秒杀80B大模型?Hugging Face推出史上最小却最强的视觉AI助手

    Hugging Face联合斯坦福大学推出革命性小型视觉AI模型SmolVLM,最小版本仅256MB却能超越300倍大小的传统模型。该系列包含三个版本,运行显存需求0.8-4.9GB,可在手机端部署。通过创新架构设计、高效tokenization和精心数据策略,在图像理解、视频分析、文档处理等任务上表现卓越,真正实现"人人可用的AI助手"。
    至顶网  科技行者  2025-07-17 11:39:06  
  • 香港科技大学突破性发现:让AI训练快人一步的神奇"刹车"技术

    香港科技大学研究团队提出GPAS技术,通过"梯度保持激活缩放"解决Pre-LayerNorm架构中激活方差指数增长问题。该技术在前向传播时缩放激活值,反向传播时保持梯度不变,在71M到1B参数模型上均显示显著性能提升。GPAS具有出色的架构兼容性,可应用于多种Transformer变体,为大型语言模型训练优化提供了简单有效的解决方案。
    至顶网  科技行者  2025-07-02 10:58:27  
  • 当AI看视频也会"产生幻觉":中科院团队首次揭示大模型视频理解的"认知盲区"

    中科院团队首次系统研究了大型多模态AI模型在视频理解中的"幻觉"问题,构建了包含6497个问题的HAVEN评估体系,发现AI看视频时会出现物体、场景、事件三类错误。研究还提出了创新的"视频思维模型"解决方案,通过让AI进行step-by-step推理,将准确率提升7.65%,偏差降低4.5%,为提升AI视频理解的可靠性提供了重要突破。
    至顶网  科技行者  2025-07-30 09:48:44  
  • 推理竟然有"隐形"版本?斯坦福&清华联合揭示大模型思维的神秘面纱

    这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。
    至顶网  科技行者  2025-07-17 13:58:26  
  • 波兰语AI安全守护神:SpeakLeash基金会推出Bielik Guard语言安全分类器

    SpeakLeash基金会联合波兰多所高校开发了专门针对波兰语的AI安全分类器Bielik Guard,通过1500多名志愿者标注6885个文本样本,训练出两个高效模型。该系统在真实用户测试中达到77.65%精确率和0.63%误报率,显著优于现有解决方案,已开源部署并支持持续社区反馈改进。
    至顶网  科技行者  2026-02-13 08:34:31  
  • 新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

    新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越GPT-4,JudgeLRM-7B击败DeepSeek-R1,在推理密集型任务上表现尤为突出,为AI评估领域带来范式转变。
    至顶网  科技行者  2025-07-16 09:12:24  
  • 腾讯提出RLPT:让AI像学生一样自主探索,不再依赖人工标注的突破性训练方法

    腾讯研究团队提出RLPT新方法,让大语言模型通过预测文章下一段内容进行自主学习,无需人工标注。该技术在多个基准测试中显著提升AI性能,特别是数学推理能力提升5-8分,为解决AI训练中的数据瓶颈和标注依赖问题提供了创新解决方案,展现出良好的可扩展性和实用前景。
    至顶网  科技行者  2025-10-14 12:08:53  
  • EleutherAI和英国AI安全研究所联手揭秘:从源头让AI拒绝危险知识的革命性方法

    这项由EleutherAI和英国AI安全研究所合作完成的研究提出了革命性的AI安全解决方案——通过在训练阶段过滤危险内容来构建本质安全的AI模型。研究团队开发了高效的数据过滤系统,成功训练出能够抵抗强力对抗攻击的AI模型,在保持通用能力的同时实现了前所未有的安全性,为开源AI模型的安全发展提供了切实可行的技术路径。
    至顶网  科技行者  2025-10-11 10:01:10  
  • 人工智能的最后一场考试:当最强AI模型遇上专家级学术难题会发生什么?

    这项由美国AI安全中心和Scale AI等机构联合开展的研究,创建了迄今最具挑战性的AI学术能力测试基准。该测试包含2500道专家级题目,涵盖数十个学科领域,由全球近千名专家贡献。测试结果显示,即使是最先进的AI系统表现也非常有限,准确率普遍在个位数,同时存在严重的"虚假自信"问题。研究揭示了AI系统与人类专家在深度学术能力方面的巨大差距。
    至顶网  科技行者  2025-09-18 11:07:46  
  • Tree-GRPO:让AI智能体学会像人类一样思考——阿里巴巴集团革命性突破提升人工智能决策能力

    阿里巴巴集团研究团队提出了Tree-GRPO,一种革命性的AI智能体训练方法。该方法通过树状结构让AI探索多种思考路径并进行比较学习,在多跳推理任务中实现了69%的性能提升,同时将训练成本降低至传统方法的四分之一。这项创新为解决AI稀疏监督和高昂训练成本问题提供了新思路。
    至顶网  科技行者  2025-10-16 17:31:03  
  • AI训练也要"刹车":BluOrion公司如何让大模型告别暴走

    BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。
    至顶网  科技行者  2025-07-16 23:13:11  
  • 阿里通义团队让AI学会"读心术"——HumanOmniV2如何让机器真正懂人心

    阿里巴巴通义实验室的研究团队开发了HumanOmniV2,这是一个能够真正"读懂"人类复杂意图和情感的AI系统。该系统通过改进强化学习方法,让AI在回答问题前必须先全面理解多模态背景信息,解决了现有AI模型忽略重要线索和缺乏全局理解的问题,在多项测试中表现优异。
    至顶网  科技行者  2025-07-03 13:59:35  
  • 苹果公司揭示思维模型的"假聪明"本质:当AI遇到真正难题时会停止思考

    苹果公司研究团队通过精心设计的拼图游戏实验,揭示了当前"思维型"AI模型的真实能力边界。这些模型在简单问题上反而表现不佳,只有在中等复杂度问题上才显示优势,而在困难问题上会完全崩溃并减少思考时间。更令人震惊的是,即使提供完整算法,模型仍无法突破复杂度限制。研究显示这些AI可能缺乏真正的逻辑推理能力,更像是高级的模式匹配系统。
    至顶网  科技行者  2025-06-12 11:22:37  
  • 约翰内斯开普勒大学突破:让计算机像人脑一样处理多维信息的神奇技术

    这项由奥地利约翰内斯开普勒大学团队开发的pLSTM技术,创新性地解决了人工智能在处理多维数据时的核心难题。通过引入源门、转换门和标记门三种机制,实现了真正的多维并行信息处理。在箭头指向外推任务中展现出优异的泛化能力,在图像识别和分子图谱分析等实际应用中也显示出强大潜力,为构建更智能的多维信息处理系统开辟了新路径。
    至顶网  科技行者  2025-06-19 12:53:35  
  • 北京大学团队首次全面评估GPT-4o图像生成能力:AI绘画竞赛中的新冠军诞生

    这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。
    至顶网  科技行者  2025-07-15 11:38:08  
  • 港科大团队破解多模态AI训练难题:让AI用文字学会"看"世界

    港科大等多院校团队发表的突破性研究,解决了多模态AI训练中的"模态差距"难题。通过精确建模文字和图像信息间的几何关系,开发出ReVision训练方法,让AI主要通过阅读文字就能学会理解图像,将训练成本降低26%,为AI训练提供了更经济高效的新路径。
    至顶网  科技行者  2026-02-10 15:33:51  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号