用了 0.028112秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容1886 条
  • QVGen:低比特量化视频生成模型的突破性研究

    QVGen是一项突破性研究,致力于解决视频扩散模型在低比特量化时的性能挑战。研究团队通过理论分析发现,降低梯度范数是改善量化感知训练收敛性的关键,因此引入了辅助模块来减轻量化误差。为消除这些模块在推理阶段的开销,他们创新性地提出了秩衰减策略,通过奇异值分解和基于秩的正则化逐步移除低影响组件。实验证明,QVGen是首个在4比特设置下达到与全精度相当性能的量化方法,其3比特实现也显著优于现有技术。这一成果为高效视频生成在普通设备上的应用铺平了道路。
    至顶网  科技行者  2025-05-23 07:41:58  
  • 拼图解密:KU Leuven团队探索视觉拼图的强化学习之旅

    这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
    至顶网  科技行者  2025-06-05 11:05:15  
  • IEEE:SambaNova的新芯片可运行比OpenAI的ChatGPT高级版大两倍以上的模型

    随着各大公司争相加入人工智能的潮流,芯片和人才供不应求。初创公司SambaNova声称,其新处理器可以帮助公司在几天内建立并运行自己的大型语言模型。
    至顶网  业界供稿  2023-10-10 09:04:56  
  • 聊天机器人用的词典可以更省电?西班牙研究团队发现AI"节能密码"

    这项研究首次系统探索了为聊天机器人定制词汇处理系统的节能潜力。通过对8个主流AI模型的测试,发现专门优化的tokenizer可减少5-10%的token数量,直接转化为相应的能耗降低。在全球AI服务规模下,这种看似微小的优化能带来显著的环保和经济效益,为AI可持续发展提供了新思路。
    至顶网  科技行者  2025-06-30 10:53:55  
  • 全球NLP最难榜单刷新:追一科技超越Facebook跃居第二

    近日,自然语言处理领域权威数据集SuperGLUE最新榜单排名更新。Google预训练模型T5保持第一,中国AI创业公司追一科技AI Lab团队超越Facebook AI,跃居榜单第二。
    至顶网  业界供稿  2020-01-16 10:05:29  
  • 解锁清晰视界:孙中山大学研究团队开创"鲁棒高斯飞溅"技术,让3D场景重建告别干扰物

    孙中山大学研究团队开发的RobustSplat技术通过两大创新解决3D高斯飞溅重建中的瞬态物体干扰问题:延迟高斯增长策略优先优化静态结构,避免早期对动态物体过度拟合;尺度级联掩码引导方法先利用低分辨率特征实现可靠初始掩码估计,再过渡到高分辨率监督获得精确预测。实验证明该方法在多个挑战性数据集上明显优于现有技术,为真实场景3D重建提供更高质量、无干扰的结果。
    至顶网  科技行者  2025-06-09 16:57:05  
  • 终极存储解决方案:把ZB级海量数据写在DNA上

    小小的双螺旋结构能够在不可思议的袖珍空间内存储惊人的信息量。
    至顶网  科技行者  2021-06-10 16:17:38  
  • 这些香港理工大学研究者如何让超长文本处理快如闪电:ZeCO技术的通信革命

    香港理工大学研究团队提出ZeCO技术,通过创新的All-Scan通信机制解决了分布式AI系统处理超长文本时的通信瓶颈问题。在256台机器上测试时,ZeCO比现有最先进方法快60%,通信时间快4倍,实现了接近理论最优的性能,为超长文本AI应用开辟了新可能。
    至顶网  科技行者  2025-07-07 10:33:59  
  • 一个字就能节省千个字:低秩克隆技术实现高效知识蒸馏,哈尔滨工业大学研究提升小型语言模型效率

    这篇论文介绍了一种名为"低秩克隆"(LRC)的新型知识蒸馏方法,能极大提升小型语言模型的训练效率。哈尔滨工业大学深圳校区和百度公司的研究团队通过训练可学习的低秩投影矩阵,同时实现了软剪枝和激活克隆,避免了传统方法中的信息损失和对齐效率低下问题。实验证明,仅用100亿-200亿文本单元训练的LRC模型性能可匹配或超越需要万亿级训练数据的现有模型,训练效率提升1000倍以上,为资源受限场景下的高性能语言模型开发提供了突破性解决方案。
    至顶网  科技行者  2025-05-23 15:25:06  
  • FinChain:金融领域首个可验证的符号化思维链推理基准测试

    MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。
    至顶网  科技行者  2025-06-09 07:25:15  
  • 脑部核磁共振正片加强!波尔多大学研发通过强化学习驱动大语言模型的神经退行性痴呆症可解释诊断框架

    法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
    至顶网  科技行者  2025-06-01 08:08:16  
  • Orin开发套件05-使用Docker容器的入门技巧

    上一篇内容为大家介绍了从NVIDIA NGC下载DeepStream 6.1的容器版镜像到本地在Jetson上设备的基础指令,不过在正式使用容器版DeepStream 6.1之前,我们还是需要为入门用户提供基本的使用方式与一些小技巧。
    至顶网  业界供稿  2022-07-29 09:37:21  
  • FPGA加速器支撑ChatGPT类大语言模型创新

    Achronix的Speedster7t FPGA具有一个独特的架构,使其非常适合这些类型的模型。
    至顶网  业界供稿  2023-08-31 13:22:42  
  • 戴森发布全新G5 Detect无绳吸尘器 全新第五代马达重塑深度清洁

    戴森重磅推出戴森史上最强劲1无绳吸尘器——G5 Detect,以第五代Hyperdymium(TM)马达再度实现技术跨越。
    至顶网  至顶网商用办公频道  2022-09-21 14:16:44  
  • 深度解析:腾讯混元团队《先走后跑》——利用强化学习实现大模型简洁推理的新突破

    腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
    至顶网  科技行者  2025-05-31 17:26:21  
  • 深圳大学团队破解3D工业检测难题:让机器像人类一样"记住"新产品缺陷

    深圳大学团队开发了C3D-AD持续学习框架,解决3D异常检测中的"灾难性遗忘"问题。系统通过三个创新模块:统一特征空间的KAL、智能信息管理的KAA和记忆保持的RPP,实现在学习新产品检测的同时保留对历史产品的检测能力,在三个数据集上取得显著性能提升。
    至顶网  科技行者  2025-08-12 10:09:59  
  • 《动森》第一天,我竟成了一名房奴

    传统数据中心基础设施往往建设周期长,设计一次定型。当企业出于业务需求要进行系统改造升级的时候,如果原有机房空间不够,放不下新增机柜,单是机房改造这一项,就意味着一番苦工和一大笔开销。
    至顶网  戴尔  2020-05-08 15:34:32  
  • 全面屏护眼更出彩 华为MateView SE显示器正式发布

    作为华为显示器产品的又一新作,华为MateView SE进一步扩充了华为显示器的产品布局,丰富了用户的选择空间,满足了更多消费者的使用需要。
    至顶网  业界供稿  2022-05-23 21:50:49  
  • 加拿大体育娱乐巨头通过数字研发实验室彻底改变运动体验

    Maple Leaf Sports & Entertainment建立了体育运动领域最大的IT工程团队之一,以探索数字解决方案和数据分析如何改变比赛、运营和球迷参与度。
    至顶网  至顶网CIO与CTO频道  2023-04-06 11:57:14  
  • 别做被动型管理者!技术转型管理如何自我修炼?

    初创团队的技术管理最容易陷入哪些误区?技术管理者应在团队中扮演怎样的角色?如何打造面向业务成功的IT组织?何谓技术领导力,又该如何修炼?
    至顶网  业界供稿  2021-04-08 15:47:14  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号