用了 0.061677秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容3949 条
  • 中国人民大学让AI搜索智能体跑得更快:扩散模型也能边思考边搜索了

    中国人民大学团队开发了DLLM-Searcher,一种基于扩散大语言模型的新型AI搜索系统。该系统通过两阶段训练和创新的P-ReAct工作模式,让AI能够边思考边搜索,避免传统搜索助手等待时间过长的问题。实验显示,该系统在保持准确率的同时,推理速度提升约15%,为AI搜索代理技术带来重要突破。
    至顶网  科技行者  2026-02-11 15:57:32  
  • 小心,存储性能宣传有大坑!

    随着全闪存的普及,存储性能的宣传战争变得越来越激进,在2008年,10万IOPS已经是非常高的性能,而十年后的今天,1000万IOPS已经成为多家厂商宣传的主题。而存储响应速度的另一个指标时延已经从毫秒演进到了微秒时代。
    至顶网  华为  2018-03-20 10:06:29  
  • QVGen:低比特量化视频生成模型的突破性研究

    QVGen是一项突破性研究,致力于解决视频扩散模型在低比特量化时的性能挑战。研究团队通过理论分析发现,降低梯度范数是改善量化感知训练收敛性的关键,因此引入了辅助模块来减轻量化误差。为消除这些模块在推理阶段的开销,他们创新性地提出了秩衰减策略,通过奇异值分解和基于秩的正则化逐步移除低影响组件。实验证明,QVGen是首个在4比特设置下达到与全精度相当性能的量化方法,其3比特实现也显著优于现有技术。这一成果为高效视频生成在普通设备上的应用铺平了道路。
    至顶网  科技行者  2025-05-23 07:41:58  
  • 拼图解密:KU Leuven团队探索视觉拼图的强化学习之旅

    这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
    至顶网  科技行者  2025-06-05 11:05:15  
  • Google Cloud全力推动,Arm正成为云端主流

    对Arm来说,2022年堪称艰难的一年。这家英国芯片设计商先是因传出可能被英伟达收购的消息而财务不振,随后又因监管机构的审查令交易胎死腹中。之后,Arm在制定IPO计划时决定裁撤员工,而当前的市场形势明显并不利于上市融资。
    至顶网  至顶网计算频道  2022-07-19 09:16:14  
  • Safe-Sora:为AI视频生成模型加上"身份证",清华大学研究团队开创图像水印新方法

    清华大学研究团队开发了一种名为Safe-Sora的创新技术,首次实现在AI视频生成过程中嵌入图形水印。该方法通过分层自适应匹配机制,智能地将水印图像分割成小块并分配到视频中最适合的位置,同时利用3D小波变换增强的Mamba架构处理视频时空特性。实验表明,与现有方法相比,Safe-Sora在保持视频质量、水印保真度和抵抗各种处理操作方面均取得了显著优势,为AI生成内容的版权保护提供了有效解决方案。
    至顶网  科技行者  2025-06-02 12:18:48  
  • IEEE:SambaNova的新芯片可运行比OpenAI的ChatGPT高级版大两倍以上的模型

    随着各大公司争相加入人工智能的潮流,芯片和人才供不应求。初创公司SambaNova声称,其新处理器可以帮助公司在几天内建立并运行自己的大型语言模型。
    至顶网  业界供稿  2023-10-10 09:04:56  
  • 院士陈润生:大数据精准医学到核酸药物

    2021年10月21-23日,第十七届2021CCF全国高性能计算学术年会(CCF HPC China 2021)上,中国科学院院士陈润生发表了《从大数据精准医学到核酸药物》主旨报告。
    至顶网  任新勃  2021-10-22 06:27:54  
  • 积极重夺制造霸主地位,英特尔不玩“纳米游戏”了

    Intel宣布,10纳米工艺还是10纳米,但是该节点(代号SuperFin)的下一代,会叫做“Intel 7”,然后再来是“Intel 4”、“Intel 3”,不会出现“纳米”这个字眼...
    至顶网  业界供稿  2021-08-04 14:19:25  
  • “Kubernetes vs. Docker”? 你恐怕搞错了对象

    几年前,Docker在IT行业可谓是家喻户晓,遍地开花。每个中小型公司都已经或是即将采用它。
    至顶网  戴尔  2021-01-14 16:08:26  
  • 聊天机器人用的词典可以更省电?西班牙研究团队发现AI"节能密码"

    这项研究首次系统探索了为聊天机器人定制词汇处理系统的节能潜力。通过对8个主流AI模型的测试,发现专门优化的tokenizer可减少5-10%的token数量,直接转化为相应的能耗降低。在全球AI服务规模下,这种看似微小的优化能带来显著的环保和经济效益,为AI可持续发展提供了新思路。
    至顶网  科技行者  2025-06-30 10:53:55  
  • 全球NLP最难榜单刷新:追一科技超越Facebook跃居第二

    近日,自然语言处理领域权威数据集SuperGLUE最新榜单排名更新。Google预训练模型T5保持第一,中国AI创业公司追一科技AI Lab团队超越Facebook AI,跃居榜单第二。
    至顶网  业界供稿  2020-01-16 10:05:29  
  • 职场“反内卷”背后,企业如何应对新时代发展大潮?

    最近,有个职场话题直戳打工人痛点,冲上知乎热搜前三:“按时下班被领导阴阳「这么早就走呀」,我该怎么回应?”
    至顶网  业界供稿  2023-08-29 17:39:18  
  • 科尔尼与Futurum:大型企业CEO将AI作为未来核心战略

    研究显示,高收入公司的CEO正将人工智能置于业务战略的核心地位。欧美企业声称已具备AI项目的基础条件。专家建议避免过度乐观,关注投资回报,构建稳健的数据基础,并优先考虑循序渐进的推广策略。研究还发现,最成功的公司往往是那些高层领导有意识地不直接参与AI战略制定的公司。
    至顶网  Computer Weekly  2025-01-22 16:46:23  
  • 仅需单一数据即可超越强化学习:Ubiquant研究团队揭示的单样本熵最小化训练法突破

    研究人员训练了13,440个大型语言模型,发现熵最小化方法仅需一个未标记数据和10步优化,就能实现比传统强化学习更好的性能提升。这种"单样本熵最小化"完全无监督,基于两个简单假设:语言模型生成过程本质上是随机的,且正确答案通常熵值更低。研究表明该方法能使模型logits分布向右偏移,增强置信度,对推理能力产生显著提升,平均提高24.7个百分点。这一发现或将重塑大型语言模型的后训练范式。
    至顶网  科技行者  2025-06-03 15:15:55  
  • 终极存储解决方案:把ZB级海量数据写在DNA上

    小小的双螺旋结构能够在不可思议的袖珍空间内存储惊人的信息量。
    至顶网  科技行者  2021-06-10 16:17:38  
  • 这些香港理工大学研究者如何让超长文本处理快如闪电:ZeCO技术的通信革命

    香港理工大学研究团队提出ZeCO技术,通过创新的All-Scan通信机制解决了分布式AI系统处理超长文本时的通信瓶颈问题。在256台机器上测试时,ZeCO比现有最先进方法快60%,通信时间快4倍,实现了接近理论最优的性能,为超长文本AI应用开辟了新可能。
    至顶网  科技行者  2025-07-07 10:33:59  
  • AI搜索改写在线可见性规则 传统搜索时代或将终结

    随着AI工具如ChatGPT的普及,学生和专业人士正逐渐放弃传统搜索引擎转向AI直接获取答案。这一变化预示着搜索引擎优化(SEO)行业的衰落和语言模型优化(LMO)的兴起。与SEO通过关键词堆砌等手段操控排名不同,LMO专注于创建真正有用的内容,让AI能够理解、信任并提供最佳答案。企业需要转变思维,从"如何获得排名"转向"如何帮助用户",通过提供原创、有价值的内容在AI搜索时代保持竞争优势。
    至顶网  Forbes  2025-06-16 14:30:19  
  • 一个字就能节省千个字:低秩克隆技术实现高效知识蒸馏,哈尔滨工业大学研究提升小型语言模型效率

    这篇论文介绍了一种名为"低秩克隆"(LRC)的新型知识蒸馏方法,能极大提升小型语言模型的训练效率。哈尔滨工业大学深圳校区和百度公司的研究团队通过训练可学习的低秩投影矩阵,同时实现了软剪枝和激活克隆,避免了传统方法中的信息损失和对齐效率低下问题。实验证明,仅用100亿-200亿文本单元训练的LRC模型性能可匹配或超越需要万亿级训练数据的现有模型,训练效率提升1000倍以上,为资源受限场景下的高性能语言模型开发提供了突破性解决方案。
    至顶网  科技行者  2025-05-23 15:25:06  
  • FinChain:金融领域首个可验证的符号化思维链推理基准测试

    MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。
    至顶网  科技行者  2025-06-09 07:25:15  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号