用了 0.407235秒,为您找到网赌 长期 盈利 方法 罔芷 88pkee 驻测相关内容11586 条
  • 视觉语言模型的"线性推理瓶颈"——爱沙尼亚塔林理工大学揭示AI视觉推理的隐藏障碍

    爱沙尼亚塔林理工大学研究团队发现,先进AI视觉模型的问题不在于"看不清"图片,而在于"想不通"图片间逻辑关系。他们提出"线性分离天花板"概念,揭示了广泛存在的"线性推理瓶颈"现象,并证明通过针对性微调可以解决这一问题。研究为改进AI视觉推理能力提供了新思路。
    至顶网  科技行者  2025-07-21 09:12:03  
  • 英飞凌与eleQtron携手打造三代离子阱量子处理器

    在开发阶段,英飞凌将为eleQtron提供三代逐步改进的离子阱,并提供必要的专业知识,使其适应MAGIC概念。通过采用协同设计策略,英飞凌将帮助eleQtron建造功能不断增加的基于离子阱的量子计算机。这些强大的量子计算机今后还将通过云端提供给工业和科研用户。
    至顶网  业界供稿  2023-08-02 09:38:07  
  • NotebookLM新增AI辩论功能,可基于笔记生成多种音频总结

    谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。
    至顶网  cnet  2025-09-04 11:36:34  
  • StreamBP:让大语言模型训练长序列变得更轻松——香港中文大学(深圳)团队突破性研究

    香港中文大学(深圳)和上海交通大学的研究团队开发了StreamBP,这是一种用于大语言模型长序列训练的内存高效反向传播方法。通过沿序列维度线性分解链式法则,StreamBP显著减少了存储激活值所需的内存,使最大序列长度比梯度检查点技术提高了2.8-5.5倍,同时保持或减少了计算时间。该方法适用于SFT、GRPO和DPO等常见训练目标,并支持多GPU分布式训练。
    至顶网  科技行者  2025-06-09 15:31:08  
  • CDO采访:法国零售商Etam集团IT负责人谈数据主导的数字化转型

    团队和执行委员会都期待着转型。
    至顶网  至顶网CIO与CTO频道  2024-06-18 12:09:10  
  • 微软发布Windows Server 20H1第一个测试版

    微软于6月18日发布了第一个“Windows Server vNext”的公共测试版, Windows Server vNext 是微软Windows Server的功能更新版。
    至顶网  ZDNet  2019-06-19 11:44:33  
  • 一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

    一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0
    至顶网  至顶AI实验室  2025-08-04 14:07:55  
  • 当AI成为自己的老师:南洋理工大学揭示大模型如何通过奖励信号自我进化

    这项由新加坡南洋理工大学主导的研究全面梳理了大型语言模型通过奖励信号学习的最新进展。研究揭示了一种革命性的AI训练范式:让AI像学生接受老师指导一样,通过奖励反馈主动学习和改进。这种方法已在ChatGPT等系统中应用,能显著提升AI在推理、对话、代码生成等任务上的表现,同时增强安全性和可靠性。
    至顶网  科技行者  2025-07-08 09:31:16  
  • HPE宣布收购有大量资金投入的网络初创公司Plexxi

    HPE今天宣布计划收购Plexxi Inc.,Plexxi是一家软件定义网络初创公司,已募集了超过8000万美元的风投资金。
    至顶网  siliconANGLE  2018-05-16 12:15:49  
  • 价值引导搜索:提升推理模型思维链的高效指南——康奈尔大学研究团队的突破性成果

    康奈尔大学研究团队提出了"价值引导搜索"方法,通过训练标记级价值模型来优化大型语言模型的推理过程。他们收集了250万个数学推理轨迹,训练了15亿参数的评估模型,实现了基于块的高效搜索。这种方法不需要预定义"步骤"概念,也无需昂贵的每步标注。在四个数学竞赛基准测试中,该方法使DeepSeek-1.5B模型达到了45.7%的平均准确率,与更大模型相当,同时显著减少了计算资源需求。研究团队开源了数据集、模型和代码,为高效人工智能推理提供了新范式。
    至顶网  科技行者  2025-05-29 12:03:07  
  • SHARE:一种基于小型语言模型的分层行动修正助手,助力文本到SQL转换

    这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
    至顶网  科技行者  2025-06-07 08:29:51  
  • DeepSeek R1 模型引发 AI 投资领域的不确定性

    DeepSeek公司最近发布的开源推理AI模型R1在开发者和研究人员中迅速流行,引发科技股大幅抛售。R1的出现以及同期宣布的Stargate项目,凸显了AI投资和商业模式的深度不确定性。这些事件引发了关于开源vs闭源AI系统、硬件vs软件优化、以及AI公司盈利模式等多方面的争议和思考。
    至顶网  Forbes  2025-02-11 16:06:12  
  • CLaSp:让大语言模型生成文本更快的自我推测解码技术

    CLaSp是一项创新的自我推测解码技术,能让大语言模型生成文本的速度提高1.3到1.7倍,同时保持输出质量不变。由中国科学院等机构联合开发的这一技术,通过动态决定模型内部哪些计算层可以被跳过,避免了传统方法需要额外训练或模块的缺点。CLaSp像是让AI在不影响烹饪质量的前提下,学会了根据菜肴复杂度灵活跳过某些烹饪步骤,从而更快地完成整道菜。
    至顶网  科技行者  2025-06-04 15:37:35  
  • Forrester咨询:火山引擎A/B测试给企业运营带来新变革

    4月26日,全球最具影响力的独立研究咨询公司之一Forrester受火山引擎委托调查并撰写的《火山引擎 A/B 测试总体经济影响白皮书》(以下简称《白皮书》)正式发布。
    至顶网  业界供稿  2022-04-29 11:49:29  
  • 中科院软件所首创"论文树状图书馆":让科研搜索像点餐一样精准到位

    中科院软件所开发的PaperRegister系统通过分层索引技术革新学术论文搜索,将传统基于摘要的粗粒度检索升级为支持技术细节的精细化搜索。该系统为每篇论文建立树状信息结构,从概况到具体实现细节分层组织,配合智能视角识别器精准理解用户查询意图。实验显示在细粒度搜索中准确率提升22.6%,响应时间仅2.5秒,为科研信息检索提供了突破性解决方案。
    至顶网  科技行者  2025-08-19 12:35:22  
  • 北大和百度联手研发:让AI像人一样"转着圈"看物体,从一张图生成多个视角图像

    北京大学和百度VIS联合研发的MV-AR技术,首次让AI学会像人类一样逐步观察物体,通过自回归方式生成多视角一致图像。该技术解决了传统方法在处理大视角差异时的一致性问题,支持文字、图像、形状等多种输入,在3D内容创作、机器人视觉等领域具有广阔应用前景。
    至顶网  科技行者  2025-06-26 10:16:17  
  • Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

    卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。
    至顶网  科技行者  2025-06-10 13:52:20  
  • 企业级智能体AI框架Agntcy正式加入Linux基金会

    智能体AI有望通过大幅改善工作流自动化来推动企业转型。Agntcy是2025年3月成立的开源组织,致力于构建"智能体互联网"框架。该框架由思科Outshift孵化部门创立,专注于智能体协调编排和身份访问管理。7月29日Linux基金会正式接纳该联盟,为框架提供更稳固的行业基础,新增戴尔、谷歌云、甲骨文云和红帽等重要成员。
    至顶网  Forbes  2025-07-30 09:24:07  
  • 破解大模型量化训练之谜:香港大学与字节跳动的量化缩放定律研究

    这项研究首次提出了一个统一的量化感知训练(QAT)缩放定律,通过268组实验揭示了模型大小、训练数据量和量化粒度对4位量化误差的影响规律。研究发现量化误差随模型增大而减少,随训练数据增加和量化粒度变粗而增加。通过分解分析,研究确定了FC2层输入的激活量化是主要瓶颈,使用8位精度处理该层可显著提升性能。这些发现为设计更高效的量化策略提供了理论指导,对推动大型语言模型的实际部署具有重要意义。
    至顶网  科技行者  2025-05-27 15:31:00  
  • 特拉维夫大学AI研究员惊人发现:越"万能"的AI攻击越善于"劫持"注意力

    特拉维夫大学研究团队通过分析GCG攻击机制,发现越狱攻击的成功依赖于"注意力劫持"现象,即攻击后缀能占据AI注意力机制的主导地位。研究表明,攻击的万能性与劫持强度直接相关,并基于此开发了增强攻击效果和防御攻击的实用方法,为AI安全研究提供了新视角。
    至顶网  科技行者  2025-06-24 10:15:34  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号