用了 0.072600秒,为您找到奔驰 宝马 游戏 网站 bcbm 網纸 YB233相关内容5917 条
  • 当AI代理不再是纸上谈兵:斯坦福MIT等顶尖院校联合推出xbench,让AI真正走进职场的革命性测试平台

    这项由18所顶尖高校联合开展的研究推出了革命性的AI代理评估平台xbench,彻底改变了传统以技术能力为中心的评测方式,转而采用真实职业场景的实战检验。研究团队在招聘和营销两个专业领域构建了完整的评估体系,让AI代理像实习生一样直接承担真实工作任务,用实际成果证明商业价值。通过对九个主流AI代理的全面测试,发现不同模型在专业任务中的表现差异显著,技术评测高分未必转化为实用价值。
    至顶网  科技行者  2025-06-24 10:11:42  
  • AGI万字长文(上) | 2023回顾与反思

    2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。
    至顶网  AIGC开放社区  2024-03-14 15:04:20  
  • Alita:极简设计打造无限创造力的通用AI助手

    Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。
    至顶网  科技行者  2025-06-01 11:15:55  
  • 机器人学会"技能混搭":斯坦福等顶尖高校让人形机器人变身全能助手

    本研究由斯坦福大学等顶尖学府联合提出SkillBlender方法,让人形机器人像人类学习技能一样先掌握基础技能,再智能混合应对复杂任务。通过预训练行走、伸手、蹲起、踏步四种原始技能,系统能以最少的奖励设计完成复杂全身协调任务。新建的SkillBench测试平台包含三种机器人、八项任务,并创新性地评估动作准确性和自然度。
    至顶网  科技行者  2025-06-19 12:53:19  
  • 吴声年度演讲全文:新物种时代的场景战略

    2021年8月15日,一年一度的“新物种爆炸·吴声商业方法发布2021”如约而至,以下为《吴声造物》梳理的演讲全文。
    至顶网  业界供稿  2021-08-16 17:37:20  
  • AI推理模型真的像宣传的那样聪明吗?Anthropic和Open Philanthropy研究人员揭露评测陷阱

    Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
    至顶网  科技行者  2025-06-18 17:44:59  
  • 日本《人工智能运营商指南(草案)》解读

    日本发布《人工智能运营商指南(草案)》,旨在应对生成式人工智能技术变化,提供统一的人工智能治理指导原则。草案分为五部分,包括人工智能定义、社会愿景、行为准则,以及针对人工智能研发者、提供者、业务用户的具体规范。
    至顶网  清华大学智能法治研究院  2024-03-03 14:04:36  
  • 大觥科技赵彬:数字人,跨时代

    2023年会是3D数字人的元年,数字人在这一年将真正跨越2D时代。
    至顶网  金旺  2023-05-09 12:42:12  
  • 大觥科技赵彬:数字人,跨时代

    2023年会是3D数字人的元年,数字人在这一年也将真正跨越2D时代。
    至顶网  金旺  2023-05-09 09:14:29  
  • 百度谭待:区块链可以与人工智能、大数据互相促进发挥更大价值

    谭待认为,区块链浪潮的来临并不是要取代互联网,而是让互联网发展得更好,区块链可以作为价值互联网的重要基础设施去推动互联网新一轮的进化,而且在技术上区块链可以与人工智能、大数据互相促进发挥更大的价值。
    至顶网  至顶网存储频道  2018-07-10 16:05:19  
  • 云计算时代,硬件为什么仍然非常重要?

    越来越多的IT经理也有同感。60多年来,处理器、内存、存储、以及其他由金属和硅制成的组件决定了计算机的潜力和局限性。IT部门的核心作用一直是保护和优化这些宝贵的资产,系统管理员和维护人员保持数据中心的运转。
    至顶网  siliconANGLE  2019-07-30 18:23:10  
  • 大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍

    深圳大学、腾讯等机构联合提出ReDit方法,通过在离散奖励信号中添加随机噪音解决AI训练中的梯度不稳定问题。该方法将学习速度提升约10倍,在数学推理等任务上显著改善模型性能,为大语言模型训练提供了简洁高效的优化方案。
    至顶网  科技行者  2025-06-26 12:50:57  
  • WAIC 2022大会第2天,你们关心的亮点都在这里

    今年大会的主题是“智联世界 元生无界”,旨在充分把握人工智能与元宇宙相融互促的发展趋势,连接汇聚世界人工智能最新观点和成果,传递无界共生的创新理念,展现上海智能时代的美好图景。
    至顶网  业界供稿  2022-09-03 19:27:10  
  • 解读亚马逊re:Invent首日,AWS CEO五十多次提及重塑 加速企业上云及数字创新

    今年的re:Invent上,Andy Jassy再次为全球40多万名注册观众带来长达三小时的主题演讲,并且一口气发布27项创新的云服务和功能(当天总共发布43项新服务和功能),令到场的媒体和分析师惊叹。
    至顶网  至顶网CIO与CTO频道  2020-12-07 10:02:47  
  • 物理驱动的精细人体动作生成:西北工业大学推出FinePhys框架,让AI生成的体操动作更加真实

    西北工业大学研究团队开发了FinePhys框架,解决了AI生成的人体动作不符合物理规律的问题。该系统通过在线估计2D姿态并转换为3D骨架,再利用欧拉-拉格朗日方程进行物理重估计,最终生成物理上合理的精细人体动作视频。在体操动作数据集上的实验显示,FinePhys生成的视频明显优于现有方法,特别是在保持生物力学结构和动作自然度方面。这一突破为影视特效、游戏开发和虚拟现实等领域带来新可能。
    至顶网  科技行者  2025-05-22 08:14:54  
  • SVGenius基准测试:大语言模型在SVG理解、编辑和生成方面的全面评估

    浙江大学研究团队开发的SVGenius是首个综合评估大语言模型SVG处理能力的基准测试系统。该研究涵盖2,377个测试样例,评估了22种主流AI模型在理解、编辑和生成三个维度上的表现。结果显示,虽然专有模型如Claude和GPT-4o表现最佳,但随着SVG复杂度增加,所有模型性能都明显下降;强化推理训练比单纯扩大模型规模更有效;风格转换是最具挑战性的任务。这一研究为开发更先进的AI辅助设计工具提供了关键见解,有望推动矢量图形技术发展和设计工作流程变革。
    至顶网  科技行者  2025-06-08 09:31:21  
  • IT领导者应力求避免的六大生成式AI危害

    OpenAI最近发布了自定义版本的ChatGPT,允许各家组织更轻松地以灵活方式使用生成式AI——但辩证法告诉我们,不存在只有积极作用的事物。
    至顶网  至顶网软件与服务频道  2023-12-08 11:43:58  
  • 疫情下的北京失业中年

    疫情之下,焉有完卵。
    至顶网  作者 :九 边  2022-06-01 23:34:08  
  • 「5G消息」打造场景化AI流量新入口

    和传统短信、RCS相比,5G消息在用户体验上,不仅支持文本、图片、视频等多媒体内容,还具备聊天机器人等智能功能,与AI接轨。
    至顶网  周雅  2024-08-20 19:39:19  
  • 第七代微软小冰再进化:开放框架,让大家创造自己的AI beings

    五年,那个永远18岁少女的微软小冰,已经从当初机械呆板的对话系统,成长为一个无处不在的人工智能交互官,她有人设、有情感、还能主动创作,然而这还不足以定义「第七代微软小冰」。
    至顶网  周雅  2019-08-16 20:33:41  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号