用了 0.053418秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 2022年新车强制安装“黑匣子”,或将促使汽车存储大爆发

    EDR及其辅助记录设备对存储的需求,以及汽车的电动化、智能化、网联化和共享化这“新四化”的推动,必将促使汽车领域的存储需求大爆发。
    至顶网  业界供稿  2021-12-21 10:38:08  
  • 更智能的小模型推理:数据视角下的思维链蒸馏基准研究——北卡罗来纳大学

    这篇研究介绍了DC-CoT,首个专门评估数据操作如何影响思维链(CoT)知识蒸馏的基准系统。北卡罗来纳大学教堂山分校等机构的研究者使用多种教师模型(如Gemini-Pro、Claude-3.5)和学生架构(3B-7B参数),系统评估了数据增强、选择和混合对学生模型在多个推理任务上的表现影响。研究发现数据增强(尤其是逆向思维)最为有效,不同任务需要不同的最优策略组合,且存在"小模型学习能力差距"—较小学生模型可能从匹配其容量的较小教师中学习更有效。
    至顶网  科技行者  2025-05-29 13:19:33  
  • 七位CIO谈如何建立咨询式IT文化

    从被动方到解决方案伙伴,IT角色的转变离不开业务优先这一思维方式的变革,以及基于成果的信誉和价值驱动文化。本次转炉会议汇集七位CIO,共商IT转型的方方面面。
    至顶网  至顶网CIO与CTO频道  2023-03-06 10:05:14  
  • 意大利卡利亚里大学首创红细胞AI"显微镜医生":血液检查准确率提升3%,诊断速度飞跃

    意大利卡利亚里大学研究团队开发了RedDino,一个专门用于红细胞形态分析的AI基础模型。该系统基于改进的DINOv2自监督学习框架,在125万张红细胞图像上训练,能够识别多种红细胞形态异常。测试结果显示,RedDino在红细胞分类任务上比现有最佳方法提升2-3%,并展现出优异的跨数据源泛化能力。研究团队已将代码和预训练模型开源,为血液学诊断提供了强大工具。
    至顶网  科技行者  2025-08-15 15:05:38  
  • 安森美领先的成像技术助您推进视觉产品创新

    安森美的Hyperlux LP系列图像传感器即具备上述的Wake on Motion低功耗技术。在增强了设备的侦测能力的同时,有效地降低功耗。
    至顶网  业界供稿  2023-11-13 15:35:02  
  • 规模法则让开源视觉语言模型比拼更公平:如何证明MaMMUT优于CLIP?

    这项研究首次通过规模法则全面比较了CLIP和MaMMUT两种视觉-语言模型,发现虽然小规模计算下CLIP表现更优,但随着计算资源增加,MaMMUT展现更强的扩展能力。研究在多种下游任务和不同开放数据集上验证了结果一致性,并基于发现训练了高性能的openMaMMUT-L/14模型。这种通过规模曲线而非单点比较的方法避免了片面结论,为模型与数据集的系统性评估提供了新范式。
    至顶网  科技行者  2025-06-10 09:25:10  
  • RICE:DeepGlint推出让AI能像人类一样精准"看懂"图片细节的新方法

    DeepGlint等机构联合发布RICE方法,通过区域感知聚类判别技术显著提升AI的图像细节理解能力。该方法构建了包含20亿区域的大规模数据集,设计了统一的物体识别和文字识别学习框架,在多项任务上超越现有主流模型,特别是在OCR和精细视觉理解方面表现突出,为多模态AI应用提供了更强大的视觉基础。
    至顶网  科技行者  2025-08-05 10:32:56  
  • 英特尔构建智能边缘技术能力,助力工业互联网向高阶迈进

    我们正处于第四次工业革命浪潮中,也正处于自2020开始新一轮的人工智能高潮中,人工智能与工业互联网的结合,推动了智能制造的发展。智能边缘,将加速助力工业互联网向更高阶段发展。
    至顶网  业界供稿  2020-07-16 10:43:21  
  • 英伟达发布全新小型开源模型Nemotron-Nano-9B-v2,支持推理开关控制

    英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
    至顶网  VentureBeat  2025-08-19 17:07:00  
  • FLAME-MoE:探秘专家混合模型的秘密花园——卡内基梅隆大学打造全透明语言模型研究平台

    FLAME-MoE是卡内基梅隆大学团队开发的首个全透明混合专家语言模型研究平台,包含7个规模从3800万到17亿活跃参数的模型。它采用每层64位专家、top-8选择和2位共享专家的架构,公开所有训练数据、代码和检查点。实验显示,FLAME-MoE比相同计算量的密集模型提升3.4个百分点,并揭示了三个关键发现:专家逐渐专注于特定词汇子集,专家协同激活保持稀疏多样,路由行为在训练早期就趋于稳定。这一平台为MoE模型的系统研究提供了前所未有的开放基础。
    至顶网  科技行者  2025-05-30 11:17:16  
  • 安全交易也能抗风险:斯科尔科沃研究团队的伊塔库拉-赛托损失函数突破性研究

    斯科尔科沃科技学院研究团队开发了一种新型损失函数——基于伊塔库拉-赛托散度的损失函数,用于解决风险敏感强化学习中的数值不稳定性问题。与传统方法相比,该损失函数不仅数值稳定,还保持尺度不变性,同时保留指数效用的理论保证。研究团队在多种金融场景和鲁棒组合优化问题上验证了其优越性,表明该方法可有效应用于金融、医疗和自动驾驶等高风险决策领域。
    至顶网  科技行者  2025-05-28 18:35:19  
  • 有这一整套方案,数据保护稳了!

    组织管理的数据平均增加了39%,而在2018年至2019年期间,宕机的平均成本增加了54%,98%的组织正在投资新兴技术,但又有71%的组织认为新兴技术会加大数据保护复杂性。
    至顶网  戴尔  2020-12-09 15:08:32  
  • 索尼发布电子纸产品:售价5666元,京东同步预约

    6月4日,索尼中国专业系统集团宣布,在中国市场发布DPT-RP1电子纸产品。新品采用高分辨率电子墨水屏,防滑面板配合手写笔,可实现媲美纸张的阅读体验和书写流畅度。DPT-RP1电子纸将为各类人群提供智能、系统的无纸化解决方案,让工作和学习方式发生飞跃。
    至顶网  科技行者  2018-06-05 08:27:59  
  • Parallels Desktop 17 for Mac发布适用于Apple M1和Intel芯片的强大新功能,全面支持Windows 11和macOS Monterey

    跨平台解决方案的全球领导者Parallels,近日宣布推出Parallels(R) Desktop 17 for Mac。
    至顶网  业界供稿  2021-08-12 16:49:12  
  • 小神器大威力:沙特团队让1.5B参数模型在阿拉伯语标音上击败了ChatGPT

    沙特阿拉伯Misraj AI公司开发出名为Sadeed的阿拉伯语标音模型,仅用15亿参数就在标音任务上超越了GPT-4等大型模型。研究团队创建了严格的数据清洗流程和全新的SadeedDiac-25评测基准,解决了现有基准数据污染问题。该模型证明了专业化小模型在特定任务上可以击败通用大模型,为阿拉伯语AI发展提供了新思路。
    至顶网  科技行者  2025-07-10 15:43:31  
  • AI时代的中兴思考:求真务实,从情绪价值向实效提升

    “回看人工智能70年的发展历程,曾经历两次寒冬和两次春天,如今正迎来第三次春天。这一次春天的来临,我们需要更加务实、冷静地看待这项技术,帮助它健康发展。”
    至顶网  于佳卉  2024-10-15 17:06:57  
  • ConvSearch-R1:利用强化学习的推理能力提升对话式搜索中的查询重构

    这篇研究论文介绍了一种名为ConvSearch-R1的创新方法,它彻底改变了对话式搜索中的查询重构方式。由复旦大学等机构研发的这一技术,通过强化学习与推理能力相结合,完全摆脱了对人工标注或大型语言模型的依赖。研究采用两阶段框架:自驱动策略预热解决冷启动问题,检索引导的强化学习则通过精心设计的奖励机制优化查询重写。实验表明,即使使用较小的3B参数模型,ConvSearch-R1也能在TopiOCQA数据集上实现超过10%的性能提升,展示了显著的技术优势和资源效率。
    至顶网  科技行者  2025-05-27 14:31:19  
  • Triton推理服务器09-为服务器添加模型

    在“创建模型仓”的文章里讲解过,Triton模型仓使用目录结构与相关文件来形成一个模型的基础要素。
    至顶网  业界供稿  2023-01-03 17:00:09  
  • 混合线性注意力机制的系统性分析:当传统Transformer遇上创新"混血"架构——加州大学圣克鲁兹分校与字节跳动的突破性研究

    这项研究通过训练72个不同配置的模型,系统分析了混合线性注意力架构的设计原则。研究发现独立表现最佳的线性注意力机制在混合架构中未必最优,并识别出选择性门控、分层递归和控制性遗忘是成功混合架构的三大关键要素。结果表明,采用3:1到6:1的线性与全注意力比例能够在保持性能的同时将内存使用量减少4-7倍。
    至顶网  科技行者  2025-07-18 09:37:33  
  • Time-R1: 让3B小模型也能拥有全面时间推理能力,击败671B大模型

    这项研究介绍了Time-R1,一个3B参数的语言模型,通过创新的三阶段强化学习训练方法,在时间推理能力上超越了参数量大200倍的模型。该框架依次建立了基础时间理解、未来事件预测和创意场景生成能力,采用精心设计的动态奖励系统指导学习过程。实验证明,小型高效模型通过专门训练可以在时间推理任务上实现卓越表现,为可扩展的时间感知AI提供了实用路径。研究团队还发布了Time-Bench数据集和模型检查点,促进该领域的进一步发展。
    至顶网  科技行者  2025-05-29 10:24:11  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号