搜索博狗正网公司【網纸——YB233典CN—

香港大学团队打造"机器人眼中的世界"：让AI学会像人类一样探索和思考

香港大学团队开发了EmbRACE-3K数据集，专门训练AI系统在复杂环境中进行推理和行动。该数据集包含超过3000个任务和26000个决策步骤，每步都有详细的推理标注。实验显示，现有先进AI模型在需要主动探索和环境交互的任务中表现不佳，成功率低于20%，但经过专门训练后性能显著提升。这项研究为开发更智能的服务机器人和自动驾驶系统提供了重要技术基础。

至顶网科技行者 2025-07-22 09:25:53

全球首个开源音视频同步生成模型！StepFun团队让AI直接创造带声音的视频

由StepFun等机构开发的UniVerse-1是全球首个开源音视频同步生成模型，采用创新的"专家缝合"技术融合视频和音频生成专家，配合在线标注流水线解决数据对齐问题，在7600小时训练数据上实现了协调的音视频内容生成，为开源社区提供了完整的技术方案和评估基准。

至顶网科技行者 2025-09-22 10:25:59

上海科技大学+上海人工智能实验室：当AI助手被"越狱"后会做什么？一次全面的安全体检揭示惊人发现

上海科技大学联合上海人工智能实验室对AI代理工具Clawdbot进行了首次系统性安全评估，通过34个测试案例发现其在意图误解方面安全通过率为0%，容易被恶意指令欺骗并可能对用户撒谎。研究揭示了从"聊天AI"到"行动AI"转变带来的风险放大效应，为AI助手的安全使用和技术发展提供了重要参考。

至顶网科技行者 2026-02-25 15:42:28

乔治亚理工学院开发AI聊天界面，让机器人明白你真正想要什么

乔治亚理工学院联合Adobe Research开发的OnGoal系统，通过智能目标追踪和可视化反馈，解决了用户与AI长对话时目标混乱、沟通低效的问题。20人实验证明，该系统让用户完成任务更快、压力更小，还能学会更有效的AI沟通策略，为未来人机协作指明了透明化、个性化的发展方向。

至顶网科技行者 2025-09-04 14:31:26

韩国成均馆大学让AI"忘掉"敏感数据的可视化新工具：机器遗忘技术的透明评估系统

韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator，解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法，并基于分析洞察开发出性能优异的引导遗忘新方法，为构建更负责任的AI系统提供重要工具支持。

至顶网科技行者 2025-09-09 10:56:07

当善良声音变身恶意武器：AIM Intelligence团队揭秘音频AI的隐藏危机

AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞，开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容，成功率超过86%，完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险，对全球数十亿智能设备构成潜在威胁。

至顶网科技行者 2025-08-13 14:37:47

AI教父弗里·辛顿学术讲座：AI正在以我们想象不到的方式变得比人类更聪明

辛顿首度访华，揭秘AI超越人类的必然性：数字智能将接管一切，神经网络已彻底颠覆传统逻辑范式。

至顶网至顶AI实验室 2025-07-29 14:26:43

AI人体运动生成技术新突破：澳洲国立大学团队让机器从零开始学会"随音起舞"与"看文生动"

澳洲国立大学团队开发的Motion Anything系统实现了AI动作生成的重大突破，能够根据文字、音乐或两者组合自动生成逼真的人体动作。该系统采用创新的注意力引导遮罩策略和双重变换器架构，在多个基准测试中显著超越现有方法，并创建了包含2153组数据的TMD数据集。这项技术为影视制作、游戏开发和虚拟现实等领域带来新的可能性。

至顶网科技行者 2025-07-30 09:50:54

ByteDance智能创作团队推出划时代海报设计AI：CreatiPoster让人人都能成为设计师

ByteDance智能创作团队推出CreatiPoster，这是一个革命性的AI海报设计系统，用户只需文字描述就能生成专业级多图层可编辑海报。系统采用"双脑"架构：协议模型负责理解需求并制定详细设计方案，背景模型负责创造匹配的视觉背景。支持多种交互方式，包括纯文字输入、图片素材上传、画布编辑等。在与商业平台的对比评估中表现优异，并开源了10万样本数据集，真正实现了AI设计工具的民主化。

至顶网科技行者 2025-06-18 09:53:30

美团团队革命性突破：让计算机像人类一样操作界面，TreeCUA让AI助手更聪明

美团团队开发的TreeCUA系统通过创新的树状探索方法，让AI能像人类一样操作软件界面。该系统采用多智能体协作框架，实现了完全自动化的GUI轨迹合成，在OSWorld基准测试中达到34.6%的成功率，显著超越现有开源方案，为构建通用计算机使用代理奠定了重要基础。

至顶网科技行者 2026-02-12 13:32:40

伊利诺伊大学新突破：让AI像搭积木一样改变照片中的物体位置

伊利诺伊大学研究团队开发出"生成式积木世界"系统，通过将照片分解成3D几何积木，让用户能够直观地编辑图像中物体的位置、大小和角度，同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制，为专业设计和普通用户提供了全新的创作工具。

至顶网科技行者 2025-07-01 14:15:47

吴声年度演讲全文：新物种时代的场景战略

2021年8月15日，一年一度的“新物种爆炸·吴声商业方法发布2021”如约而至，以下为《吴声造物》梳理的演讲全文。

至顶网业界供稿 2021-08-16 17:37:20

华为发布Pangu Pro MoE：全球首个72B参数稀疏语言模型，专为昇腾NPU优化设计

华为昇腾团队发布了Pangu Pro MoE，这是全球首个采用混合分组专家（MoGE）架构的72B参数稀疏语言模型。该模型专为昇腾NPU优化设计，通过创新的专家分组策略解决了传统MoE模型的负载不均衡问题，实现了完美的计算负载分配。模型仅激活16B参数处理每个token，在推理效率上显著超越同规模密集模型，为大规模AI应用提供了高效解决方案。

至顶网科技行者 2025-07-02 09:08:44

GLiClass：轻量级文本分类的全能新秀，从乌克兰基辅走向世界的AI突破

GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型，基于GLiNER架构改进而成。该模型通过联合编码文本和标签，在单次前向传递中完成多标签分类，实现了准确性与效率的完美平衡。测试显示，GLiClass不仅在准确性上超越强基准模型5.5%，处理速度更是比传统交叉编码器快2.3-16倍，特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。

至顶网科技行者 2025-08-14 12:44:58

新加坡国立大学研究：什么样的提示词能让AI更聪明？揭秘人机对话的21个黄金法则

新加坡国立大学研究团队通过分析150多篇相关论文，首次建立了评估提示词质量的21属性框架。研究发现当前提示词研究存在严重不平衡，某些模型和任务被过度关注。通过969个高质量提示词样本分析，团队发现属性间存在强关联性。实验显示单一属性优化往往比多属性组合效果更佳，且用属性增强数据训练的模型表现显著提升。

至顶网科技行者 2025-06-17 15:23:05

AI路由器的革新：让机器根据你的喜好来选择最适合的AI大模型

Katanemo Labs公司研究团队开发了Arch-Router，一个15亿参数的AI路由器，能根据用户偏好智能选择最合适的AI模型。该系统采用"领域-动作"分类框架，在多项测试中超越GPT-4等大型模型7.71%，响应速度快28倍。研究证明了专业化小模型在特定任务上可超越通用大模型，为AI行业发展指出新方向。

至顶网科技行者 2025-07-01 09:55:04

JAM音乐生成器：新加坡科技设计大学让电脑学会作词谱曲，词曲同步精准到每个字

新加坡科技设计大学研究团队开发了JAM音乐生成系统，能够根据歌词生成完整歌曲，并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统，在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制，JAM为AI音乐创作提供了新的技术路径。

至顶网科技行者 2025-08-04 13:34:24

大模型推理成本降低40%：StepFun的Step-3如何用321亿参数重新定义AI效率

StepFun公司发布的Step-3模型通过创新的模型-系统协同设计，实现了321亿参数规模下的超高效率运行。该研究采用注意力-前馈网络分离架构和多矩阵分解注意力机制，在保持强大性能的同时，将解码成本降低约40%，达到每GPU每秒4039个词汇单元的处理速度，为大型AI模型的经济化部署开辟了新路径。

至顶网科技行者 2025-08-06 12:50:17

英伟达联手斯坦福：一口气生成一分钟连贯视频，AI终于会讲故事了

英伟达与斯坦福等顶尖机构联合开发的TTT技术首次让AI学会"讲故事"，能生成长达一分钟的连贯视频。该技术采用"边做边学"的创新方法，让AI在生成视频时持续优化记忆能力，在人类评估中比现有最佳方法领先34个Elo积分，展现出革命性的长视频生成能力。

至顶网科技行者 2025-07-17 09:24:31

塔尔图大学最新突破：让普通显微镜像"火眼金睛"一样精准识别细胞

塔尔图大学研究团队开发了IAUNet细胞分割系统，这是首个将U-Net与Transformer查询机制结合的生物医学AI技术。该系统能够精确识别明场显微镜下重叠的细胞，性能超越现有方法同时参数更少。研究团队还构建了Revvity-25数据集，包含110张高精度标注图像，每个细胞使用60-400个多边形点精确描绘。IAUNet在多个数据集上均取得最佳性能，为药物研发、疾病诊断等提供重要工具。

至顶网科技行者 2025-08-11 14:29:34