用了 0.056049秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容5680 条
  • 浙大团队揭秘:为什么AI机器人在现实世界中总是"掉链子"?OmniEAR基准测试暴露惊人真相

    浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
    至顶网  科技行者  2025-08-13 14:36:32  
  • Yale研究团队突破传统:Table-R1开创表格推理的全新境界

    Yale大学自然语言处理实验室研发的Table-R1模型突破性地将推理时间缩放技术应用于表格推理任务。研究团队通过两种方法提升模型能力:从DeepSeek-R1模型的推理过程中学习,以及利用可验证奖励进行强化学习。实验表明,即使使用仅有7B参数的模型,Table-R1-Zero也能在13个表格推理基准测试中媲美甚至超越GPT-4.1等大型模型。该研究不仅证明了中小规模模型通过适当训练也能实现出色表现,还为数据分析、科学研究和决策支持系统等实际应用提供了新可能。
    至顶网  科技行者  2025-06-03 17:39:47  
  • IBM研究院揭秘:当AI助手遇到"狡猾"用户,政策防线为何轻易失守?

    IBM研究团队通过CRAFT系统揭示AI助手在面对恶意用户时的脆弱性。该研究发现,即使最先进的AI助手在遭遇精心设计的诱导攻击时,政策违反率高达70%,远超传统攻击方法。团队开发的τ-break测试集专门评估AI在政策遵守方面的表现,结果显示现有防御措施效果有限。这项研究为AI安全评估提供了新视角,强调需要考虑恶意用户场景,对未来AI系统的安全部署具有重要指导意义。
    至顶网  科技行者  2025-06-19 12:54:06  
  • 让AI学会真正理解人类情感:腾讯研究团队首次用真情实感训练出会安慰人的AI助手

    腾讯研究团队首次开发出RLVER框架,通过可验证的情感反馈训练AI理解人类情感。该方法让70亿参数的小型AI模型在情感智能测试中从13.3分跃升至79.2分,达到大型商业模型水平。研究创新性地使用虚拟用户的真实情感变化作为训练信号,并发现"先思考再回应"模式显著提升AI的共情能力。这项突破为AI情感智能发展开辟新路径,有望在心理健康支持、教育和客户服务等领域产生广泛应用。
    至顶网  科技行者  2025-07-17 13:56:57  
  • 共谱数据的冰与火之歌:Techo TVP 开发者峰会圆满落幕!

    2021年4月24日,由腾讯云 TVP 主办的首届 Techo TVP 开发者峰会「数据的冰与火之歌——从在线数据库技术,到海量数据分析技术」在深圳深铁皇冠假日酒店成功举办。
    至顶网  业界供稿  2021-04-29 09:45:13  
  • 阿里云如何让“创新扩散”,做中国企业出海的隐形推手?

    如今进入全面被AI渗透的时代,AI创新将再次重塑云计算的底层能力,并在全球化进程中与云相互赋能、共同成长,推动中国企业实现全球化布局与技术升级的双向奔赴。
    至顶网  高飞  2025-03-11 20:34:02  
  • 英特尔发布重大技术架构的改变和创新,面向CPU、GPU和IPU

    这些新架构将为即将推出的高性能产品注入动力,并为英特尔的下一个创新时代奠定基础,以满足世界对高计算能力日益增长的需求。
    至顶网  业界供稿  2021-08-20 09:27:28  
  • watsonx新篇章:IBM宣布开源、产品及生态系统的多项创新以推动企业级AI的规模化应用

    昨天晚上,在美国波士顿举行的一年一度THINK大会上,IBM宣布了有关一年前发布的watsonx 平台的几项新的更新,以及即将推出的新的数据与自动化功能,旨在使人工智能(AI)对企业而言更具开放性、成本效益与灵活性。
    至顶网  业界供稿  2024-05-23 08:58:43  
  • 亚马逊云科技宣布推出生成式AI新工具

    我们正处在一个令人激动的机器学习被大规模采用的转折点上,我们也相信生成式AI将会重塑大量客户体验和应用程序。
    至顶网  至顶网CIO与CTO频道  2023-04-14 11:56:31  
  • 一场数据架构变革正在来临

    现有数据架构难以支撑现代化应用的实现。
    至顶网  至顶网CIO与CTO频道  2021-12-21 18:29:35  
  • 大语言模型的"分层蛋糕":东南大学最新研究让AI不再"胡说八道"

    东南大学研究团队开发的LayerCake方法通过分析大语言模型内部的"分层蛋糕"结构,发现不同层次处理不同类型信息的规律,创新性地采用对比解码技术来减少AI生成错误信息的问题。该方法在多个测试中显著提升了模型的事实准确性,为AI安全应用提供了重要技术支撑。
    至顶网  科技行者  2025-07-22 09:25:20  
  • 物声相应:交互式感知物体的图像到音频生成技术——加州大学伯克利分校与字节跳动联合研究突破

    这项研究提出了一种交互式物体感知的图像到音频生成模型,让用户能够针对图像中选定的特定物体生成相应声音。研究团队将物体中心学习整合到条件潜在扩散模型中,通过多模态注意力机制学习图像区域与声音的对应关系。用户可通过分割蒙版选择目标物体,系统会精确生成相关音频。理论分析证明其注意力机制在功能上等同于测试时的分割蒙版,确保了生成音频与选定物体的准确对应。实验表明该模型在声音-物体对齐方面显著优于现有技术,为内容创作、虚拟现实和辅助技术等领域开辟了新可能。
    至顶网  科技行者  2025-07-07 17:33:28  
  • AI智能体的新思路:CMU团队发现"多行动"比"深思考"更有效

    卡内基梅隆大学团队发现AI智能体"多试试"比"多想想"更有效的新规律。研究提出TTI方法,通过增加交互步骤而非延长单步思考时间来提升性能。在网页任务中,该方法让AI学会探索、比较和调整策略,在WebVoyager和WebArena基准测试中创下开源模型新纪录。这一发现挑战了传统"深思考等于高智能"的假设,为构建更适应复杂现实环境的AI系统开辟了新方向。
    至顶网  科技行者  2025-06-16 11:29:03  
  • 「底层」文科生和天坑专业人,正在争夺码农Offer

    「“转码”正在成为不那么好找工作的——文史哲、土木、建筑、“四大天坑”生化环材(生化、化学、环境、材料)等专业毕业生们的主动选择。今日推荐后浪研究所(id:youth36kr)一篇文章,程序员依然是高性价比的工作选择。」
    至顶网  至顶网码客人生频道  2022-09-20 10:35:42  
  • 阿里巴巴团队让AI学会了完美"表演":一张照片秒变生动说话视频

    阿里巴巴团队首次实现仅凭一张照片生成逼真说话视频的AI技术突破。该系统不仅能完美同步嘴唇动作,还能自然展现面部表情、肢体动作和背景变化,并支持个性化的动作强度控制。这项技术将显著降低视频内容制作门槛,为在线教育、企业培训、数字营销等领域带来革命性变化。
    至顶网  科技行者  2025-07-14 09:47:49  
  • 从讲师到up主,一位程序员为何能抓住流量密码

    「杨中科怎么也没想到,作为一个大龄程序员,他竟然以这样的方式走红了」
    至顶网  尼酱  2022-08-01 11:04:31  
  • 打造自主信息搜索智能体:阿里巴巴WebDancer的探索之路

    阿里巴巴集团和同义实验室的研究团队推出了WebDancer,这是一种能够在网络上自主搜索信息并回答复杂问题的智能体系统。研究团队提出了一个四阶段构建框架,包括数据合成、轨迹采样、监督微调和强化学习。他们创新性地开发了CRAWLQA和E2HQA两种方法来生成高质量训练数据,并采用ReAct框架使智能体能够交替进行思考和行动。实验结果表明,WebDancer在GAIA和WebWalkerQA等基准测试中表现优异,甚至在某些情况下超越了GPT-4o,证明了该方法在构建自主信息搜索智能体方面的有效性。
    至顶网  科技行者  2025-06-01 18:59:36  
  • CASS:跨越Nvidia与AMD的代码转译突破——来自MBZUAI的数据、模型与基准测试解决方案

    MBZUAI和澳大利亚国立大学的研究团队开发了CASS,这是首个大规模跨架构GPU代码转译系统,实现了Nvidia和AMD之间的源代码和汇编级代码转换。该项目包含7万对验证代码对,展示了源代码转换95%和汇编转换37.5%的准确率,远超GPT-4o等商业基准。CASS生成的代码在85%以上的测试中保持了与原生代码相当的性能,并通过CASS-Bench提供严格的评估基准。所有资源已开源,为GPU代码可移植性开辟了新途径。
    至顶网  科技行者  2025-06-09 07:22:22  
  • ZeroGUI:零人工成本下自动化在线GUI学习的突破性研究

    ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。
    至顶网  科技行者  2025-06-03 18:35:51  
  • 如何拯救Uber?

    最近优步汽车(Uber)导致一位自行车骑行者因车祸遇难的事件引发了多方关注。很多人认为,系统能力低下的责任应由优步公司承担,但也有些人认为,事故本身并不值得大做文章。在笔者看来,此类事故确实可以通过技术方式加以避免。
    至顶网  科技行者  2018-03-30 15:16:22  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号