用了 0.273963秒,为您找到澳门 网站 平台 網纸 YB233相关内容27867 条
  • 告别过度思考:浙江大学研究团队开发自制动力训练让大型语言模型更高效推理

    浙江大学研究团队开发的"自制动力训练"(Self-Braking Tuning,SBT)方法解决了大型语言模型在推理过程中的过度思考问题。该方法不依赖外部干预,而是培养模型自主识别冗余推理并适时终止的能力。研究者通过分析推理效率比率和过度思考标记比率,构建了两种数据策略:SBT-E(精确版)和SBT-D(动态版)。实验结果表明,经过训练的模型在多个数学基准测试上保持原有准确率的同时,将标记消耗减少了30%到60%,显著提高了推理效率。这项创新使AI系统能更像人类一样有效思考,为资源受限环境下的AI部署提供了新解决方案。
    至顶网  科技行者  2025-05-28 08:11:02  
  • 智城十年,云谱新篇 巴蜀大地绽放蓬勃生机

    四川省作为2012年中国首批智慧城市试点的省域之一,紧抓各城市发展的鲜明底色,加速建设智慧城市。
    至顶网  业界供稿  2022-11-01 17:49:50  
  • LMU Munich等机构重磅突破:让超级AI助手在手机上安家的全新联邦学习技术

    这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架,创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块,结合Fisher合并技术处理数据异质性,实现了95%的存储减少和99%的通信优化,同时保持了优异性能,为AI技术的普及化应用开辟了新路径。
    至顶网  科技行者  2025-06-24 15:44:05  
  • 这些香港理工大学研究者如何让超长文本处理快如闪电:ZeCO技术的通信革命

    香港理工大学研究团队提出ZeCO技术,通过创新的All-Scan通信机制解决了分布式AI系统处理超长文本时的通信瓶颈问题。在256台机器上测试时,ZeCO比现有最先进方法快60%,通信时间快4倍,实现了接近理论最优的性能,为超长文本AI应用开辟了新可能。
    至顶网  科技行者  2025-07-07 10:33:59  
  • 小米发布MiMo-VL-7B:一款令人惊艳的开源视觉语言模型,通用性能与推理能力双双突破

    小米LLM-Core团队开源了两款强大的视觉语言模型MiMo-VL-7B-SFT和MiMo-VL-7B-RL,在通用视觉理解和多模态推理领域创下新纪录。仅有7B参数的MiMo-VL-7B-RL在40项评测中的35项上超越Qwen2.5-VL-7B,在OlympiadBench上达到59.4分,超越了参数量达78B的模型。研究采用四阶段预训练与混合在线策略强化学习相结合的方法,处理了2.4万亿个标记。研究发现,预训练阶段纳入高质量推理数据至关重要,而混合强化学习虽提升性能但存在多任务同步优化挑战。
    至顶网  科技行者  2025-07-07 17:34:10  
  • 荣耀如何用第一性原理造手机?

    8年前,荣耀是怎么确定下AI这个赛道,并敢于定下在全球市场与苹果三星竞争的目标?
    至顶网  高飞  2024-04-25 18:33:18  
  • 混合云时代,华云网络的“驭云术”

    随着虚拟化、云原生等新技术的快速发展,企业数据中心基础设施也发生了翻天覆地的变化,开始从传统架构全面转向云架构,这让混合云架构被越来越多的企业所认可并采用。
    至顶网  戴尔  2021-04-15 15:02:00  
  • 浙大联合蚂蚁集团揭秘:为什么开源AI在数据分析上总是败给商业模型?

    浙大联合蚂蚁集团通过系统性研究发现,开源AI在数据分析上表现不佳的根本原因是缺乏战略规划能力。研究团队通过精心设计的数据合成方法,成功提升了开源模型的表现,14B模型甚至能媲美GPT-4,证明了高质量训练数据比海量数据更重要,为开源AI在数据分析领域的发展指明了新方向。
    至顶网  科技行者  2025-06-27 11:44:40  
  • 多智能体 AI 提示工程进阶指南

    本文介绍了一种新的提示方法,旨在充分利用多智能体人工智能系统。随着智能体AI的兴起,我们将面临如何通过提示来调用合适的智能体AI完成任务的挑战。文章探讨了"驾驶员座位"和"乘客座位"两种提示方法,并提供了实际应用示例。同时还介绍了最新的多智能体AI研究进展,包括基于句子嵌入的智能体推荐技术。
    至顶网  Forbes  2025-03-03 10:08:44  
  • HARDTESTS:提升LLM编程能力的高质量测试用例合成研究

    卡内基梅隆大学等机构研究团队推出HARDTESTS,解决AI编程测试的可靠性危机。研究显示现有测试集有高达60%的通过测试程序实际存在错误,而80%的编程问题无法获取人类编写的官方测试用例。团队开发的HARDTESTGEN管道通过三种方式生成测试:直接生成的小规模输入、随机常规输入和专门设计发现隐藏错误的"黑客输入"。实验证明,与现有方法相比,HARDTESTS在评估AI代码时准确率提升11.3个百分点,召回率提升17.5个百分点,对困难问题的准确率提升可达40个百分点。
    至顶网  科技行者  2025-06-04 16:06:19  
  • 合规起舞、安全启航,企业出海如何保障自身“生命线”

    如何在不同地域、不同文化、不同制度下做到安全合规?这个问题在 3 月 29 日“大咖说出海”第二期中得到了解答。
    至顶网  业界供稿  2022-03-30 13:32:30  
  • 当AI拥有了永久记忆:上海交通大学团队打造的MemOS让大模型告别"健忘症"

    上海交通大学团队开发了MemOS记忆操作系统,让AI拥有真正的长期记忆能力。该系统统一管理参数记忆、激活记忆和明文记忆三种类型,通过MemCube智能单元实现记忆的生命周期管理和跨类型转换。在LOCOMO基准测试中,MemOS在所有推理任务上均获得最佳成绩,特别在多跳推理和时间推理中表现突出。
    至顶网  科技行者  2025-07-11 15:22:44  
  • 为什么机器人最终学会"偷懒"反而更聪明?——田纳西理工大学重新定义探索与利用的关系

    田纳西理工大学研究发现,在特定条件下,纯粹追求短期利益的人工智能反而会自发表现出探索行为。研究通过多臂老虎机和网格世界实验证实,当环境具有重复结构且智能体拥有足够记忆时,贪婪策略能够产生类似Thompson采样的探索效果。这一发现挑战了探索与利用必须对立的传统观点,为简化强化学习算法设计提供了新思路。
    至顶网  科技行者  2025-08-07 11:12:08  
  • 对话“平板电脑之父”:创业精神,和任正非聊天,以及未来操作系统

    冒险是创业常态,如何挑选正确的合作伙伴,对于创业至关重要。
    至顶网  周雅  2019-12-24 12:19:52  
  • 向“荒谬”的能源需求量说拜拜 以太坊计划将能耗降低99%

    以太坊正在积极“瘦身”,希望借此应对其它高效率区块链方案带来的挑战压力。
    至顶网  科技行者  2019-01-08 09:53:10  
  • Hitachi Vantara CTO Jason Hardy 谈公司存储革新

    日立万塔拉正在进行存储策略更新,统一高端和中端产品线,拥抱全闪存和混合云。公司重回企业存储领域,简化产品组合,现代化技术,同时保持稳定性和可靠性。此外,公司还在积极布局AI市场,推出Hitachi IQ解决方案,并探索AI技术在存储管理和客户支持中的应用。
    至顶网  BLOCKS & FILES  2025-01-24 10:27:42  
  • 微软让AI学会"画像"用户:推荐系统变身贴心管家的秘密武器

    微软研究团队开发了LettinGo框架,通过让AI用自然语言生成用户画像来改进推荐系统。该方法分三步:多模型探索生成多样化用户档案,通过实际推荐效果评估档案质量,最后用偏好对齐技术训练专门的档案生成器。在三个主要数据集上的实验显示,相比传统方法平均准确率提升20个百分点,且生成的档案更灵活、可解释性更强。
    至顶网  科技行者  2025-06-26 10:12:25  
  • 机器学习的入门平台天花板,还可免费实操经典教程,确实也没谁了

    到底靠不靠谱,我们亲测了下。
    至顶网  至顶网人工智能频道  2021-12-22 16:25:19  
  • 图表博物馆:测试大型视觉-语言模型的视觉推理能力——德克萨斯大学奥斯汀分校团队开创性研究

    德克萨斯大学奥斯汀分校的研究团队开发了一个名为CHARTMUSEUM的全新基准测试,专门评估大型视觉-语言模型理解图表的能力。研究表明,即使最先进的AI模型在图表视觉推理任务上远远落后于人类表现——虽然人类能达到93%的准确率,但最佳模型Gemini-2.5-Pro仅达到63%,开源模型表现更差。研究揭示模型在处理视觉推理问题时比文本推理问题表现低35%-55%,并通过错误分析确定了当前模型在符号选择、视觉比较、轨迹跟踪和数值识别等方面的关键挑战,为未来模型改进提供了明确方向。
    至顶网  科技行者  2025-05-22 08:16:20  
  • 香港大学团队首创针对AI事实核查系统的"真相反转"攻击法

    香港大学团队首次发现AI事实核查系统的重大安全漏洞,开发出名为Fact2Fiction的攻击方法,能够系统性欺骗最先进的事实核查系统。研究显示即使投入极少量精心制作的虚假证据,就能让AI系统40-60%的时间得出错误结论,成功率比现有攻击方法高出8.9-21.2%。该研究揭示了AI系统透明度设计的双刃剑效应,为开发更安全可靠的下一代系统提供重要启示。
    至顶网  科技行者  2025-08-14 12:47:33  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号