搜索大发玩和值的稳定必中方法规【罔芷:——88pk·ee—

谷歌DeepMind重磅突破：AI机器人学会了像人类一样思考和决策

谷歌DeepMind发布突破性AI规划技术，让机器人学会像人类一样进行"情境学习"规划。该技术通过Transformer架构实现了快速适应新问题的能力，在迷宫导航、机器人控制等测试中表现优异，为自动驾驶、智能制造、医疗等领域应用奠定基础，标志着向通用人工智能迈出重要一步。

至顶网科技行者 2025-08-27 15:23:13

从科幻到现实：复旦大学发布全球首个多模态统一奖励模型，让AI像人类评委一样判断图像和视频质量

复旦大学联合上海人工智能实验室发布的UnifiedReward是全球首个统一多模态奖励模型，能够同时评价图片和视频的生成与理解任务。该模型通过跨任务协同学习，在各项评测中都显著超越了专门的单任务模型，在图片理解任务上准确率提升近20个百分点。这项技术为AI评价体系带来革命性突破，将大大降低AI系统开发成本，提升各种视觉AI产品的整体质量。

至顶网科技行者 2025-08-04 11:16:11

阿里巴巴团队发布GUI-Owl：让AI像人类一样操作电脑和手机的智能助手

阿里巴巴团队发布了GUI-Owl智能助手，这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练，在多项测试中超越现有模型，配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率，为GUI自动化领域带来重大突破。

至顶网科技行者 2025-08-29 09:31:31

让AI学会"动起来"：上海交大团队打造史上最大人体动作数据库，让机器人动作更自然

上海交通大学研究团队构建了迄今最大的人体动作数据库MotionMillion，包含200万个动作序列，并训练出70亿参数的AI模型，实现了根据文字描述生成自然人体动作的零样本能力。该技术采用创新的六步数据处理流程和小波变换优化，在动作质量和文本对齐度方面显著超越现有方法，为动画制作、机器人控制、虚拟现实等领域开辟了新的应用前景。

至顶网科技行者 2025-07-18 09:37:02

KAIST团队推出Mol-LLaMA：首个能真正"看懂"分子的AI助手，药物发现新时代来临

韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息，不仅能准确预测分子特性，还能详细解释背后的科学原理，在药物发现、化学教育等领域展现出巨大应用潜力，为分子科学研究开启了AI辅助的新时代。

至顶网科技行者 2025-08-22 09:34:37

0.5B参数也能超越7B模型？西湖大学团队让机器人操控成本狂降38倍

西湖大学团队开发出VLA-Adapter机器人控制系统，仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换，训练成本降低38倍，推理速度快3倍，在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模，为机器人控制技术普及提供了新路径。

至顶网科技行者 2025-09-25 13:14:46

南洋理工大学团队突破：让AI学会在复杂光影中完美合成图像，无需额外训练就能处理水面倒影和阴影效果

南洋理工大学研究团队开发出SHINE方法，这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能，能够在复杂光影条件下完美合成图像，包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集，验证了SHINE在各种挑战性场景中的卓越性能，为图像编辑技术的发展开辟了新方向。

至顶网科技行者 2025-10-16 18:01:29

北京科学院联合字节跳动重磅发布：让AI真正"看懂图片思考"的全新评测基准和训练方法

中科院联合字节跳动开发全新AI评测基准TreeBench，揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法，通过要求AI同时给出答案和精确定位，实现真正可追溯的视觉推理，为构建更透明可信的AI系统开辟新路径。

至顶网科技行者 2025-07-18 16:07:11

港中文突破！让AI学会"一步步思考"生成图像，告别胡乱画图时代

港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成，通过语义规划和细节优化的双层推理机制，在复杂图像生成任务上比基础模型提升13-19%，甚至超越了业界最强的FLUX.1模型，为AI创意产业应用开辟新路径。

至顶网科技行者 2025-07-10 15:42:03

香港中大突破视频编辑难题：让你轻松掌控每一帧画面的神奇技术

这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术，通过巧妙结合LoRA适应技术和遮罩机制，解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面，就能让编辑效果自然传播到整个视频，同时可通过参考图片进一步控制编辑外观，在多项对比测试中均超越现有先进方法。

至顶网科技行者 2025-06-19 12:54:25

北京人工智能研究院推出SPAR：让学术论文搜索变得像问朋友一样简单

北京人工智能研究院开发的SPAR系统通过五个专业智能助手协同工作，实现了比传统学术搜索高56%的效果提升。该系统首创的RefChain引用链机制能自动发现相关文献，配套的SPARBench基准测试平台为学术搜索领域提供了标准化评估工具，已开源供研究者使用。

至顶网科技行者 2025-07-28 10:16:12

对话维克托教授：再见金融资本主义，你好大数据资本主义

在过去数年间，维克托教授经常到访中国，我们也一直和维克托教授保持相当频繁的交流，追踪他对大数据产业和泛科技产业的最新看法和判断。

至顶网赛博故事（ID：cybergushi） 2018-12-25 13:19:34

人工智能与深度学习技术16大回顾，承包你一年的知识点

激动人心的2017年已结束，博客WildML的作者、曾在Google Brain做了一年Resident的Denny Britz，就分享出这一年他对AI和深度学习领域重点事件的回顾与梳理。可以说，这16个要点，能在让你在人工智能圈子里装逼一年不落伍！

至顶网 CNET科技行者 2018-01-05 10:16:05

对话Rokid赵维奇：AR为什么是探索现实世界“副本”的最佳形态

作为中美连续创业者，赵维奇的创业之路非常宽泛，做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在，赵维奇作为Rokid全球开发者生态负责人，也参与负责Rokid多款软硬件产品设计与研发。他回忆说，最早加入Rokid是在实验室，开发Rokid第一代AR眼镜，相当于是一个小组在做内部创业的过程。

至顶网周雅 2024-09-09 15:22:53

DeepSeek-AI推出DeepSeek-R1：不需要人工标注，AI模型竟能自己学会推理！

DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型，无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越，在AIME 2024中达到79.8%准确率，编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型，使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。

至顶网科技行者 2025-09-19 10:05:34

字节跳动重磅发布OmniHuman-1.5：会"思考"的虚拟人，告别千篇一律的呆板表演

字节跳动推出OmniHuman-1.5，首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考，结合创新的MMDiT架构和伪最后帧技术，让虚拟人不再只是机械地同步口型，而是能够根据说话内容的语义做出相应的表情和动作，大幅提升了虚拟人表现的自然度和智能化水平，为教育、娱乐、客服等领域带来革命性应用前景。

至顶网科技行者 2025-09-03 11:37:21

法国团队打造医学界的智能图书管理员：一个能从海量论文中挖出临床宝藏的AI工具

法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched，通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略，先用大型AI模型评估40万段落质量，再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果，为医学AI发展提供了高效可持续的解决方案。

至顶网科技行者 2025-06-30 17:58:08

字节跳动推出FinSearchComp：让AI在金融搜索领域接受"真枪实弹"的考验

字节跳动联合哥伦比亚商学院推出首个开源金融搜索AI评测基准FinSearchComp，通过635个专业问题测试21个AI模型的金融数据搜索能力。研究发现最优AI模型在全球市场达到68.9%准确率，接近人类专家75%水平，但在复杂分析任务上仍存在显著差距，为AI在专业领域应用提供了重要的能力基准。

至顶网科技行者 2025-10-13 08:57:42

新南威尔士大学首创ZARA：让AI像侦探一样从运动传感器数据中识别人类活动

新南威尔士大学研究团队开发了ZARA系统，这是首个零样本运动识别框架，能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理，不仅实现了比现有最强基线高2.53倍的识别准确率，还提供清晰的自然语言解释，为可穿戴设备和健康监护等应用领域带来了突破性进展。

至顶网科技行者 2025-08-27 15:22:41

腾讯深圳大学革命性突破：让电脑理解语言的秘密武器终于诞生

腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破，通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象，在多项测试中表现优异，已在客服、教育、医疗等领域开始应用，未来有望广泛改善人机交互体验。

至顶网科技行者 2025-08-27 10:31:04