用了 0.140138秒,为您找到澳洲 幸运 10 怎么 網纸 YB233相关内容14588 条
  • 视觉指令瓶颈调优:通过信息压缩提升多模态大语言模型的鲁棒性

    这篇研究介绍了"视觉指令瓶颈调优"(Vittle)方法,该方法通过应用信息瓶颈原理,增强多模态大语言模型应对分布偏移的能力。研究不依赖增加数据量或模型规模,而是教会模型像人类一样进行"概念压缩",在保留关键信息的同时丢弃冗余细节。在45个数据集的30种分布偏移场景中,Vittle显著提高了模型的鲁棒性,同时保持了标准任务上的出色表现,且几乎不增加推理时间。
    至顶网  科技行者  2025-05-27 10:26:51  
  • 中科大团队的惊人突破:让AI学会像人一样熟练使用工具!

    中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的关键影响,为AI工具使用能力评估建立了新标准。
    至顶网  科技行者  2025-09-25 14:41:33  
  • 程序员的时代红利快消失了,我要抓住它

    人人都在焦虑中奋力奔跑。在知乎上,有人唱衰互联网大厂,有人问现在成为程序员是不是晚了,有人说35岁后的程序员都去哪了?这些问题一直热议不断。
    至顶网  2 0 社  2022-03-10 18:29:31  
  • 凯文·凯利2018最新演讲:未来25年将发生什么

    《连线》杂志创始主编凯文·凯利发表了《What is Next》的主题演讲。凯文·凯利被看作是“网络文化”的发言人和观察者,他的书可能大家也很了解,《失控》《科技想要什么》和《必然》等书籍,影响了很多信息科技领域的从业者,人们也经常亲昵地称他为KK,
    至顶网  至顶网存储频道  2018-07-11 16:47:39  
  • 威斯康星大学突破:让AI智能体告别致命错误的神奇方法

    威斯康星大学麦迪逊分校研究团队提出TAPE框架,通过多路径规划、数学优化求解、约束执行控制和动态调整机制,有效解决AI智能体在资源受限环境中的规划错误和执行偏差问题。实验显示该方法在困难任务中成功率平均提升21个百分点,为AI系统的可靠性设计提供了新思路,有望在自动驾驶、医疗诊断等关键领域产生重要应用价值。
    至顶网  科技行者  2026-02-28 10:42:08  
  • ByteDance推出Hyper-Bagel框架:让AI理解和生成图像的速度提升20多倍

    ByteDance研究团队推出Hyper-Bagel统一加速框架,通过分而治之策略同时优化多模态AI的理解和生成能力。该框架在理解任务上实现2倍加速,图像生成速度提升16.67-22倍,并开发出近实时的1-NFE模型,为AI实际应用扫清了重要的速度障碍。
    至顶网  科技行者  2025-10-13 15:14:08  
  • 东北大学团队突破文本人物搜索技术:让机器像人一样"看懂"人物描述

    这项研究通过创新的梯度注意力机制和500万张图片的WebPerson数据集,显著提升了文本描述人物检索的准确性。GA-DMS框架能智能识别描述中的关键词汇,过滤噪声干扰,在标准测试中达到77.6%的准确率,为安防监控、人员搜寻等应用提供了重要技术支撑。
    至顶网  科技行者  2025-09-12 16:48:47  
  • 芯片行业王者之战:Arm发布其架构的第九个版本

    就在新任首席执行官Pat Gelsinger宣布英特尔公司的重塑计划正好一周之后,Arm发布了其架构的第九个版本,并且提出了该公司对下一个十年的愿景。
    至顶网  siliconANGLE  2021-04-07 09:04:12  
  • 游戏开发经验总结:分布式架构、数据库与进程设计

    如果把游戏看成一辆赛车,那么,游戏开发在其中扮演着至关重要的发动机角色,控制着玩家所感知到的剧情、关卡、实时社交沟通、版本更新、兼容和性能等问题。
    至顶网  业界供稿  2018-01-22 09:40:29  
  • Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

    Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。
    至顶网  科技行者  2025-09-04 09:59:03  
  • 复旦大学推出OmniAVS:让AI看懂、听懂并解释视频中的每一个细节

    复旦大学研究团队推出OmniAVS数据集和OISA系统,实现AI对音视频内容的全模态理解和推理。该系统支持8种表达方式的复合指令,能同时处理文字、语音、声音、图片信息,不仅准确识别目标对象还能解释判断过程。在多项测试中表现出色,为智能教学、医疗诊断、安全监控等领域应用奠定基础。
    至顶网  科技行者  2025-08-05 13:23:39  
  • 这台“水下变形金刚”,正接受NASA测试,面向高难度海底工作

    Aquanaut代表着一种全新设计,其创造者是一家名为Houston Mechatronics(简称HMI)的初创企业,该公司希望借此彻底颠覆海底机器人技术。
    至顶网  科技行者  2019-08-12 15:04:51  
  • 深度睡眠解码器:华盛顿大学团队破解梦境密码,让植物人与世界重新对话

    华盛顿大学研究团队成功开发出能够检测重度意识障碍患者大脑活动的"翻译系统",准确率达89%。该技术通过脑电图和人工智能算法,发现近40%被判定为"植物人"的患者实际仍有意识。系统不仅能诊断意识状态,还能预测康复前景,为患者家庭带来希望,推动了脑机接口技术革命性进展。
    至顶网  科技行者  2025-09-28 13:48:51  
  • AI大模型"刷题训练"的隐形枷锁:斯坦福大学揭示RLVR技术的意外局限性

    斯坦福大学等机构的研究团队通过理论分析和实验验证,揭示了当前AI大模型训练中广泛使用的RLVR技术存在"无形枷锁"现象。研究发现RLVR主要是在基础模型已有知识范围内进行概率重分配,很难真正扩展AI的推理边界,同时在精度提升的代价下可能损失探索多样化解决方案的能力,为未来AI训练方法的改进提供了重要理论指导。
    至顶网  科技行者  2025-07-24 16:26:51  
  • 加拿大女王大学:开源AI生态系统中的"版权炸弹"即将引爆?

    加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
    至顶网  科技行者  2025-10-09 14:35:23  
  • 视觉赋能大脑:让多模态大语言模型在真实空间中看见、思考与控制

    这项由上海人工智能实验室等机构联合发布的研究提出了VeBrain框架,成功解决了多模态大语言模型在现实世界应用中的关键挑战。VeBrain通过将机器人控制重新定义为2D视觉空间中的文本任务,统一了多模态理解、视觉空间推理和物理控制三大能力。研究团队还创建了包含60万条高质量指令数据的VeBrain-600k数据集,并设计了创新的机器人适配器将模型决策转化为实际运动。实验结果表明,VeBrain在13个多模态基准和5个空间智能基准上表现优异,并在实际机器人应用中展示出强大的适应性和组合能力。
    至顶网  科技行者  2025-06-06 17:29:14  
  • HANRAG:让AI问答更聪明的新武器——蚂蚁集团重磅发布多跳问答"大脑"

    蚂蚁集团研发的HANRAG系统通过智能调度模块"Revelator",能根据问题类型选择最优处理策略:直接回答、单步搜索、并行处理或逐步推理。系统具备强大噪音过滤能力,在单跳和多跳问答测试中全面超越现有方法,准确率提升6-20%,搜索效率显著改善,为智能问答系统发展开启新篇章。
    至顶网  科技行者  2025-09-26 11:43:54  
  • 机器人学会自己总结经验:瑞士苏黎世联邦理工学院开发出会反思和记忆的智能机器人

    瑞士苏黎世联邦理工学院研发的EXPTEACH系统让机器人首次具备了类人学习能力。通过双重记忆机制,机器人能从失败中学习并将经验应用到新任务,成功率从22%提升至80%。系统还观察到机器人自主创新行为,如使用工具解决问题。这项突破性研究为通用智能机器人发展开辟了新道路。
    至顶网  科技行者  2025-07-28 11:49:57  
  • “女博士”张晴晴的硬核AI创业经:做数据难于做芯片

    人们普遍认为,AI科学家每天的工作是构建高大上的模型,但其实绝大多数时间都用在了数据上,他们也想用好的数据帮助建模,但结果却是像围城一样——这是很多AI科学家共同的难题。
    至顶网  周雅  2023-02-26 23:38:42  
  • 南洋理工大学揭晓:AI看视频为何总是"错过关键细节"?全新基准测试让机器智能无所遁形

    南洋理工大学研究团队开发了名为"视频思维测试"的新基准,通过1000个精心设计的YouTube短视频揭示了AI视频理解的真实水平。测试发现,即使是最强AI模型GPT-4o的正确率也只有36.6%,远低于人类的84.3%。研究指出AI主要存在时空混淆、世界知识缺失和复杂情节理解困难三大问题,为改进AI视频理解能力指明了方向。
    至顶网  科技行者  2025-07-25 09:37:02  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号