用了 0.047756秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3248 条
  • EWMBENCH:全面评估机器人世界模型的场景、动作和语义质量

    EWMBENCH是一个专为评估具身世界模型而设计的基准框架,由AgBot等多家机构联合开发。与普通视频生成不同,具身模型需要生成物理合理、动作一致的行为,尤其适用于机器人操作场景。该基准从视觉场景一致性、运动正确性和语义对齐三个维度评估模型,基于精心构建的多样化数据集,涵盖家庭和工业环境中的十类任务。研究结果显示,经过领域适应的模型表现最佳,而现有视频生成模型在应对具身任务时仍存在诸多限制。该研究为未来机器人世界模型开发提供了重要指导和评估工具。
    至顶网  科技行者  2025-05-19 14:57:15  
  • 安全堆栈需要像攻击者一样思考,实时评估每个用户

    随着人工智能的发展,企业面临着前所未有的安全挑战。40%以上的企业欺诈现在由AI驱动,能够模仿真实用户行为、绕过传统防御系统,并以压倒性的速度进行攻击。2024年,近90%的企业遭受攻击,半数损失超过1000万美元。为应对这一威胁,安全团队需要采用全新的思维方式和技术手段,实时评估每个用户的风险,构建更加智能和动态的防御体系。
    至顶网  VentureBeat  2025-04-15 12:10:56  
  • 让AI模型自己找出弱点并主动改进:微软打造的"自我反思"训练新方法

    微软联合多所知名高校开发了SwS框架,让AI模型能够自主识别学习弱点并生成针对性练习题进行自我改进。该方法在数学推理任务上取得显著效果,7B和32B模型平均性能分别提升10%和7.7%。通过"弱点诊断-针对性出题-强化训练"的三步流程,AI首次实现了真正意义上的自我反思式学习,不依赖外部知识灌输即可持续优化自身能力,为人工智能的自主学习开辟了新道路。
    至顶网  科技行者  2025-06-19 12:56:00  
  • AMD全栈战略浮出水面:开源很好,所以我们要造GPU、ROCm和AI机架全生态

    在AI圈子里,大家或许听到过这样的话术,“AI创新既是一场马拉松,也是一场短跑”,此时此刻我在AMD Advancing AI这场关乎未来AI计算格局的会上,脑中多次浮现出这句话。
    至顶网  周雅  2025-06-13 14:44:21  
  • AMD全栈战略浮出水面:开源很好,所以我们要造GPU、ROCm和AI机架全生态

    在AI圈子里,大家或许听到过这样的话术,“AI创新既是一场马拉松,也是一场短跑”,此时此刻我在AMD Advancing AI这场关乎未来AI计算格局的会上,脑中多次浮现出这句话。
    至顶网  周雅  2025-06-13 12:55:37  
  • 7.10发布会倒计时|首款专为边缘计算场景定制款

    近段时间以来,“新基建”无疑成为了社会各界关注的焦点。“新基建”在各个行业的加速建设,将会极大地推动数据爆发性增长,更将成为各行各业未来发展最主要的驱动力。
    至顶网  戴尔  2020-07-07 15:29:30  
  • 为什么说生成式AI需要新的设计方式?

    在面谈会中讨论生成式AI,与会者们从担忧到惊奇可谓反应不一。而风险投资者——特别是像我这样在公司始创之初就与创始人合作的风险投资者——总会强调我们正处于技术生命周期的“起始阶段”。
    至顶网  至顶网软件与服务频道  2023-10-30 10:31:27  
  • 图视角解密大模型知识结构:俄勒冈大学研究揭示大语言模型如何组织和存储知识

    这项研究首次从图论视角探索大语言模型的知识结构模式,揭示了模型知识的三峰分布特性、节点度数与知识水平的正相关关系,以及知识同质性现象——拓扑位置相近的实体往往具有相似的知识水平。基于这些发现,研究团队开发了图神经网络模型来预测实体知识水平,并证明了这种方法在选择高价值三元组进行模型微调时的有效性,特别是在专业领域知识方面取得了显著提升。
    至顶网  科技行者  2025-06-03 15:15:07  
  • 神奇的思考机器:研究团队让AI学会了像人类一样深度思考

    弗吉尼亚大学联合多所顶尖院校研发出能量基础变换器(EBTs),首次让AI具备真正的深度思考能力。与传统AI的快速反应不同,EBTs通过学会"评判"答案质量并持续优化,实现了动态计算分配、不确定性表达和自我验证三大认知能力。实验显示其学习效率比传统方法提高35%,思考能力提升29%,为AI发展开辟了从"记忆检索"向"智慧判断"转变的新路径。
    至顶网  科技行者  2025-07-04 17:44:34  
  • 英伟达突破:让AI看懂几小时长视频的"超级大脑"训练术

    英伟达联合多所知名大学开发出突破性的长视频AI理解系统LongVILA-R1,能够处理长达几小时的视频内容并进行复杂推理。该系统通过5.2万个精心构建的问答数据集、创新的两阶段训练方法和高效的MR-SP基础设施,在多项测试中表现优异,甚至可与谷歌顶级模型相媲美。这项技术在体育分析、教育、医疗、安防等领域具有广阔应用前景。
    至顶网  科技行者  2025-07-19 12:53:26  
  • 独家对话傅利叶智能顾捷:做第一家量产通用人形机器人的公司

    人形机器人是通用人工智能的最后一公里。
    至顶网  金旺  2023-07-06 19:15:59  
  • Vox-Profile:USC和约翰霍普金斯大学联合打造的全面语音特征分析基准测试

    Vox-Profile是南加州大学和约翰霍普金斯大学联合开发的语音特征全面分析基准测试系统,能从语音中识别说话者的静态特征(如年龄、性别、口音)和动态特征(如情绪、语流)。研究团队使用15个以上的公开语音数据集和多种语音基础模型进行测试,发现在多数任务中参数量更大的模型表现更佳。该系统展示了三种主要应用:分析语音识别系统性能差异、评估语音生成系统质量,以及自动生成说话风格描述。人类评估结果表明,Vox-Profile生成的描述与人工标注相当,为语音技术研究提供了新的方向和工具。
    至顶网  科技行者  2025-05-27 10:12:27  
  • 能力差距决定破解能力:大语言模型红队测试的能力缩放规律

    这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
    至顶网  科技行者  2025-06-01 16:11:36  
  • 让AI自己发现错误并改正:中科大团队推出首个工具调用自我纠错能力评估基准

    中科大团队发布CRITICTOOL基准,首次系统评估大型语言模型工具调用自我批判能力。研究发现当前AI模型包括GPT-4o在内,遇到工具使用错误时恢复能力有限,最高仅达70%水平。该基准通过内部错误和外部环境错误两大类五种模式,结合数据进化策略,为AI工具使用可靠性评估提供重要参考。
    至顶网  科技行者  2025-06-24 10:12:53  
  • 引领财务数字化转型,共创世界一流财务管理体系

    财务数字化作为财务管理的发力点和突破点,已然是公认的事实,换句话说,财务数字化转型成为企业建设世界一流财务体系的核心路径。
    至顶网  元年  2022-07-19 15:34:10  
  • 华为的几件“小事”,要帮行业完成智能进化这件“大事”

    我们正处于一个数字化转型的大时代。对于技术公司而言,在也走到了一个分水岭,面对复杂的需求,是分一块小蛋糕?还是联手做大蛋糕?答案显而易见,单打独斗已是过往,“生态”正成为产业高频词。
    至顶网  周雅  2019-03-21 17:18:56  
  • 携手共创可持续未来 IBM用混合云和AI加速企业云转型

    正是看到企业在混合云方面的挑战,IBM持续加大推进企业混合云转型的投入。IBM第三季度的财报显示,当季营收总额达141亿美元,按固定汇率计算增长15%;过去12个月,混合云营收为222亿美元,年增长达 20%。
    至顶网  李祥敬  2022-12-14 09:43:19  
  • 一个程序员眼中的双减

    “教培行业没希望了,能跑赶紧跑。”
    至顶网  至顶网码客人生频道  2022-05-27 15:49:14  
  • AI 代理决策的错误假设

    许多组织在实施 AI 代理时过于狭隘地关注单一决策模型,陷入了"一刀切"决策框架的误区。然而,人类决策远非统一,而是复杂、动态且依赖于具体情境的。如果要将 AI 代理有效整合到组织中,就需要考虑多样化的决策过程,以确保有效实施,避免无意中设定一个低标准的决策模式。
    至顶网  Forbes  2025-04-05 17:06:47  
  • 万亿“双碳”风口之下,初创企业如何找准赛道,顺势突围?

    掌握数字化创新技术的初创企业是推动“数字经济”和“绿色经济”发展不可替代的重要力量。
    至顶网  业界供稿  2022-05-18 13:14:58  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号