搜一下
用了 0.100356秒,为您找到
大发
玩和值
稳定
中方
法规
罔芷
88pkee
驻测
相关内容7993 条
谷歌DeepMind重磅突破:AI机器人学会了像人类一样思考和决策
谷歌DeepMind发布突破性AI规划技术,让机器人学会像人类一样进行"情境学习"规划。该技术通过Transformer架构实现了快速适应新问题的能力,在迷宫导航、机器人控制等测试中表现优异,为自动驾驶、智能制造、医疗等领域应用奠定基础,标志着向通用人工智能迈出重要一步。
至顶网
科技行者 2025-08-27 15:23:13
从科幻到现实:复旦大学发布全球首个多模态统一奖励模型,让AI像人类评委一样判断图像和视频质量
复旦大学联合上海人工智能实验室发布的UnifiedReward是全球首个统一多模态奖励模型,能够同时评价图片和视频的生成与理解任务。该模型通过跨任务协同学习,在各项评测中都显著超越了专门的单任务模型,在图片理解任务上准确率提升近20个百分点。这项技术为AI评价体系带来革命性突破,将大大降低AI系统开发成本,提升各种视觉AI产品的整体质量。
至顶网
科技行者 2025-08-04 11:16:11
阿里巴巴团队发布GUI-Owl:让AI像人类一样操作电脑和手机的智能助手
阿里巴巴团队发布了GUI-Owl智能助手,这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练,在多项测试中超越现有模型,配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率,为GUI自动化领域带来重大突破。
至顶网
科技行者 2025-08-29 09:31:31
让AI学会"动起来":上海交大团队打造史上最大人体动作数据库,让机器人动作更自然
上海交通大学研究团队构建了迄今最大的人体动作数据库MotionMillion,包含200万个动作序列,并训练出70亿参数的AI模型,实现了根据文字描述生成自然人体动作的零样本能力。该技术采用创新的六步数据处理流程和小波变换优化,在动作质量和文本对齐度方面显著超越现有方法,为动画制作、机器人控制、虚拟现实等领域开辟了新的应用前景。
至顶网
科技行者 2025-07-18 09:37:02
KAIST团队推出Mol-LLaMA:首个能真正"看懂"分子的AI助手,药物发现新时代来临
韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息,不仅能准确预测分子特性,还能详细解释背后的科学原理,在药物发现、化学教育等领域展现出巨大应用潜力,为分子科学研究开启了AI辅助的新时代。
至顶网
科技行者 2025-08-22 09:34:37
0.5B参数也能超越7B模型?西湖大学团队让机器人操控成本狂降38倍
西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模,为机器人控制技术普及提供了新路径。
至顶网
科技行者 2025-09-25 13:14:46
南洋理工大学团队突破:让AI学会在复杂光影中完美合成图像,无需额外训练就能处理水面倒影和阴影效果
南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。
至顶网
科技行者 2025-10-16 18:01:29
北京科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
至顶网
科技行者 2025-07-18 16:07:11
港中文突破!让AI学会"一步步思考"生成图像,告别胡乱画图时代
港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。
至顶网
科技行者 2025-07-10 15:42:03
香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术
这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
至顶网
科技行者 2025-06-19 12:54:25
北京人工智能研究院推出SPAR:让学术论文搜索变得像问朋友一样简单
北京人工智能研究院开发的SPAR系统通过五个专业智能助手协同工作,实现了比传统学术搜索高56%的效果提升。该系统首创的RefChain引用链机制能自动发现相关文献,配套的SPARBench基准测试平台为学术搜索领域提供了标准化评估工具,已开源供研究者使用。
至顶网
科技行者 2025-07-28 10:16:12
对话维克托教授:再见金融资本主义,你好大数据资本主义
在过去数年间,维克托教授经常到访中国,我们也一直和维克托教授保持相当频繁的交流,追踪他对大数据产业和泛科技产业的最新看法和判断。
至顶网
赛博故事(ID:cybergushi) 2018-12-25 13:19:34
人工智能与深度学习技术16大回顾,承包你一年的知识点
激动人心的2017年已结束,博客WildML的作者、曾在Google Brain做了一年Resident的Denny Britz,就分享出这一年他对AI和深度学习领域重点事件的回顾与梳理。可以说,这16个要点,能在让你在人工智能圈子里装逼一年不落伍!
至顶网
CNET科技行者 2018-01-05 10:16:05
对话Rokid赵维奇:AR为什么是探索现实世界“副本”的最佳形态
作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。
至顶网
周雅 2024-09-09 15:22:53
DeepSeek-AI推出DeepSeek-R1:不需要人工标注,AI模型竟能自己学会推理!
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
至顶网
科技行者 2025-09-19 10:05:34
字节跳动重磅发布OmniHuman-1.5:会"思考"的虚拟人,告别千篇一律的呆板表演
字节跳动推出OmniHuman-1.5,首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考,结合创新的MMDiT架构和伪最后帧技术,让虚拟人不再只是机械地同步口型,而是能够根据说话内容的语义做出相应的表情和动作,大幅提升了虚拟人表现的自然度和智能化水平,为教育、娱乐、客服等领域带来革命性应用前景。
至顶网
科技行者 2025-09-03 11:37:21
法国团队打造医学界的智能图书管理员:一个能从海量论文中挖出临床宝藏的AI工具
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。
至顶网
科技行者 2025-06-30 17:58:08
字节跳动推出FinSearchComp:让AI在金融搜索领域接受"真枪实弹"的考验
字节跳动联合哥伦比亚商学院推出首个开源金融搜索AI评测基准FinSearchComp,通过635个专业问题测试21个AI模型的金融数据搜索能力。研究发现最优AI模型在全球市场达到68.9%准确率,接近人类专家75%水平,但在复杂分析任务上仍存在显著差距,为AI在专业领域应用提供了重要的能力基准。
至顶网
科技行者 2025-10-13 08:57:42
新南威尔士大学首创ZARA:让AI像侦探一样从运动传感器数据中识别人类活动
新南威尔士大学研究团队开发了ZARA系统,这是首个零样本运动识别框架,能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理,不仅实现了比现有最强基线高2.53倍的识别准确率,还提供清晰的自然语言解释,为可穿戴设备和健康监护等应用领域带来了突破性进展。
至顶网
科技行者 2025-08-27 15:22:41
腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生
腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。
至顶网
科技行者 2025-08-27 10:31:04
<
上一页
391
392
393
394
395
396
397
398
399
400
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号