用了 0.100356秒,为您找到大发 玩和值 稳定 中方 法规 罔芷 88pkee 驻测相关内容7993 条
  • 谷歌DeepMind重磅突破:AI机器人学会了像人类一样思考和决策

    谷歌DeepMind发布突破性AI规划技术,让机器人学会像人类一样进行"情境学习"规划。该技术通过Transformer架构实现了快速适应新问题的能力,在迷宫导航、机器人控制等测试中表现优异,为自动驾驶、智能制造、医疗等领域应用奠定基础,标志着向通用人工智能迈出重要一步。
    至顶网  科技行者  2025-08-27 15:23:13  
  • 从科幻到现实:复旦大学发布全球首个多模态统一奖励模型,让AI像人类评委一样判断图像和视频质量

    复旦大学联合上海人工智能实验室发布的UnifiedReward是全球首个统一多模态奖励模型,能够同时评价图片和视频的生成与理解任务。该模型通过跨任务协同学习,在各项评测中都显著超越了专门的单任务模型,在图片理解任务上准确率提升近20个百分点。这项技术为AI评价体系带来革命性突破,将大大降低AI系统开发成本,提升各种视觉AI产品的整体质量。
    至顶网  科技行者  2025-08-04 11:16:11  
  • 阿里巴巴团队发布GUI-Owl:让AI像人类一样操作电脑和手机的智能助手

    阿里巴巴团队发布了GUI-Owl智能助手,这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练,在多项测试中超越现有模型,配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率,为GUI自动化领域带来重大突破。
    至顶网  科技行者  2025-08-29 09:31:31  
  • 让AI学会"动起来":上海交大团队打造史上最大人体动作数据库,让机器人动作更自然

    上海交通大学研究团队构建了迄今最大的人体动作数据库MotionMillion,包含200万个动作序列,并训练出70亿参数的AI模型,实现了根据文字描述生成自然人体动作的零样本能力。该技术采用创新的六步数据处理流程和小波变换优化,在动作质量和文本对齐度方面显著超越现有方法,为动画制作、机器人控制、虚拟现实等领域开辟了新的应用前景。
    至顶网  科技行者  2025-07-18 09:37:02  
  • KAIST团队推出Mol-LLaMA:首个能真正"看懂"分子的AI助手,药物发现新时代来临

    韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息,不仅能准确预测分子特性,还能详细解释背后的科学原理,在药物发现、化学教育等领域展现出巨大应用潜力,为分子科学研究开启了AI辅助的新时代。
    至顶网  科技行者  2025-08-22 09:34:37  
  • 0.5B参数也能超越7B模型?西湖大学团队让机器人操控成本狂降38倍

    西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模,为机器人控制技术普及提供了新路径。
    至顶网  科技行者  2025-09-25 13:14:46  
  • 南洋理工大学团队突破:让AI学会在复杂光影中完美合成图像,无需额外训练就能处理水面倒影和阴影效果

    南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。
    至顶网  科技行者  2025-10-16 18:01:29  
  • 北京科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法

    中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
    至顶网  科技行者  2025-07-18 16:07:11  
  • 港中文突破!让AI学会"一步步思考"生成图像,告别胡乱画图时代

    港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。
    至顶网  科技行者  2025-07-10 15:42:03  
  • 香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术

    这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
    至顶网  科技行者  2025-06-19 12:54:25  
  • 北京人工智能研究院推出SPAR:让学术论文搜索变得像问朋友一样简单

    北京人工智能研究院开发的SPAR系统通过五个专业智能助手协同工作,实现了比传统学术搜索高56%的效果提升。该系统首创的RefChain引用链机制能自动发现相关文献,配套的SPARBench基准测试平台为学术搜索领域提供了标准化评估工具,已开源供研究者使用。
    至顶网  科技行者  2025-07-28 10:16:12  
  • 对话维克托教授:再见金融资本主义,你好大数据资本主义

    在过去数年间,维克托教授经常到访中国,我们也一直和维克托教授保持相当频繁的交流,追踪他对大数据产业和泛科技产业的最新看法和判断。
    至顶网  赛博故事(ID:cybergushi)  2018-12-25 13:19:34  
  • 人工智能与深度学习技术16大回顾,承包你一年的知识点

    激动人心的2017年已结束,博客WildML的作者、曾在Google Brain做了一年Resident的Denny Britz,就分享出这一年他对AI和深度学习领域重点事件的回顾与梳理。可以说,这16个要点,能在让你在人工智能圈子里装逼一年不落伍!
    至顶网  CNET科技行者  2018-01-05 10:16:05  
  • 对话Rokid赵维奇:AR为什么是探索现实世界“副本”的最佳形态

    作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。
    至顶网  周雅  2024-09-09 15:22:53  
  • DeepSeek-AI推出DeepSeek-R1:不需要人工标注,AI模型竟能自己学会推理!

    DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
    至顶网  科技行者  2025-09-19 10:05:34  
  • 字节跳动重磅发布OmniHuman-1.5:会"思考"的虚拟人,告别千篇一律的呆板表演

    字节跳动推出OmniHuman-1.5,首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考,结合创新的MMDiT架构和伪最后帧技术,让虚拟人不再只是机械地同步口型,而是能够根据说话内容的语义做出相应的表情和动作,大幅提升了虚拟人表现的自然度和智能化水平,为教育、娱乐、客服等领域带来革命性应用前景。
    至顶网  科技行者  2025-09-03 11:37:21  
  • 法国团队打造医学界的智能图书管理员:一个能从海量论文中挖出临床宝藏的AI工具

    法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。
    至顶网  科技行者  2025-06-30 17:58:08  
  • 字节跳动推出FinSearchComp:让AI在金融搜索领域接受"真枪实弹"的考验

    字节跳动联合哥伦比亚商学院推出首个开源金融搜索AI评测基准FinSearchComp,通过635个专业问题测试21个AI模型的金融数据搜索能力。研究发现最优AI模型在全球市场达到68.9%准确率,接近人类专家75%水平,但在复杂分析任务上仍存在显著差距,为AI在专业领域应用提供了重要的能力基准。
    至顶网  科技行者  2025-10-13 08:57:42  
  • 新南威尔士大学首创ZARA:让AI像侦探一样从运动传感器数据中识别人类活动

    新南威尔士大学研究团队开发了ZARA系统,这是首个零样本运动识别框架,能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理,不仅实现了比现有最强基线高2.53倍的识别准确率,还提供清晰的自然语言解释,为可穿戴设备和健康监护等应用领域带来了突破性进展。
    至顶网  科技行者  2025-08-27 15:22:41  
  • 腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生

    腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。
    至顶网  科技行者  2025-08-27 10:31:04  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号