用了 0.054116秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容4442 条
  • 颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR

    颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
    至顶网  至顶AI实验室  2025-07-17 17:24:04  
  • 2018 OpenPOWER中国高峰论坛召开

    2018年12月12日,由OpenPOWER基金会主办的2018 OpenPOWER中国高峰论坛在北京举行。
    至顶网  业界供稿  2018-12-14 10:55:13  
  • 2021 年 IBM 服务器和存储用户关心的 5 大问题

    有幸和大家谈一谈新常态和新变化下, IBM 服务器和存储用户关心的 5 个问题。
    至顶网  侯淼  2021-07-26 15:17:29  
  • 游戏测试揭秘:大语言模型玩游戏到底有多厉害?——加州大学圣地亚哥分校研究团队带你了解LMGAME-BENCH

    LMGAME-BENCH是一项创新研究,通过六款经典游戏评估大语言模型的游戏能力。研究发现直接让模型玩游戏效果不佳,因此团队设计了感知、记忆和推理支架来解决视觉识别弱、提示敏感和数据污染等问题。测试13款顶级模型显示,o3和o1表现最佳,且不同游戏考验不同能力组合。有趣的是,在某一游戏上训练模型不仅提升该游戏表现,还能增强其在规划和决策任务上的能力,证明游戏环境既是有效的评估工具,也是有价值的训练场景。
    至顶网  科技行者  2025-05-27 14:37:03  
  • SynthRL:新加坡国立大学团队如何通过可验证数据合成提升视觉推理能力

    新加坡国立大学研究团队开发的SynthRL是一种创新的数据合成管道,旨在提升视觉语言模型的推理能力。该方法通过三阶段流程自动生成更具挑战性的训练数据:首先基于难度选择模型已掌握的简单问题,然后生成保留原始答案的更复杂变体,最后验证问题的正确性与难度增加。应用于MMK12数据集后,研究生成了3300多个高质量问题,并在五个视觉数学推理基准上实现显著性能提升,尤其在最困难的样本上效果最为明显。这一研究证明了智能数据合成在增强AI推理能力方面的重要价值,为视觉语言模型的进一步发展开辟了新途径。
    至顶网  科技行者  2025-06-06 17:28:14  
  • HoliTom:西湖大学团队提出全息式令牌合并技术,让视频大语言模型推理速度提升14倍

    这项来自西湖大学的研究提出HoliTom,一种创新的令牌合并技术,能将视频大语言模型的计算成本降低到原始的6.9%,同时保持99.1%的性能。该方法通过全局冗余感知的时间合并、智能空间合并和内部LLM合并三重策略,全面减少视频处理中的冗余信息,使模型响应速度提升2.28倍,解码吞吐量增加1.32倍,为高效视频内容理解系统开辟了新可能。
    至顶网  科技行者  2025-05-31 08:22:12  
  • SSR:通过推理引导式空间理解增强视觉语言模型的深度感知能力

    SSR是西湖大学研究团队开发的创新框架,通过引入深度感知增强视觉语言模型的空间理解能力。该方法将原始深度数据转换为结构化的推理语言,作为中间表示,显著提升空间推理能力。研究团队还创建了包含超过百万级的SSR-COT数据集和SSRBENCH评估基准。实验表明,SSR无需重新训练现有模型即可提供显著性能提升,在空间任务上最高改进22.5个百分点,为机器人和计算机视觉领域开创了新的可能性。
    至顶网  科技行者  2025-05-26 08:13:18  
  • Prot2Token:通过下一个标记预测统一蛋白质建模的全新框架

    Prot2Token是密苏里大学研究团队开发的一种突破性蛋白质建模框架,它通过将各种蛋白质预测任务转化为统一的下一个标记预测问题,解决了传统方法需要为不同任务开发专门模型的限制。这个框架以自回归解码器为核心,配合预训练蛋白质编码器和任务标记引导,实现了从蛋白质序列到结构、功能和相互作用的多样化预测。实验证明其性能媲美甚至超越专门方法,并在结构预测上比AlphaFold2快1000倍。Prot2Token通过多任务学习促进了不同预测任务间的协同效应,为蛋白质研究提供了高效、通用的计算范式。
    至顶网  科技行者  2025-06-03 09:46:56  
  • 聊聊我在新加坡的生活和工作体验

    「 聊到移民话题,除了欧美,还有许多人会提到新加坡。作为一个经济实力强大、中西文化交融、教育发展卓越的国家,新加坡一直是华人最喜爱的宜居之地之一,吸引着国内越来越多的程序员移民过去。今日推荐 Keegan小钢(id:keeganlee_me)一篇文章。
    至顶网  至顶网码客人生频道  2022-08-29 10:14:18  
  • ARM服务器之战即将爆发:AWS正面对阵微软

    亚马逊云科技过去几年来一直努力推动其Graviton产品线,AWS各大区域与数据中心正在全面迎接ARM新势力的到来。如今,微软也开始在Azure云上发布新实例,显然也想在ARM服务器芯片领域一展身手。
    至顶网  至顶网软件与服务频道  2022-04-08 10:47:46  
  • 5G赋能 共建未来

    9月19日,以“Hello 5G 赋能未来”为主题的第十一届天翼智能生态博览会在广州盛大开幕。在第十一届天翼智能生态产业高峰论坛上,Qualcomm中国区董事长孟樸发表题为《5G赋能 共建未来》的主题演讲...
    至顶网  业界供稿  2019-09-19 18:10:13  
  • AWS助力客户通过数字孪生,提升业务价值

    从业者希望通过数字孪生改善运营态势、增强产品供应、交付更佳的业务价值,AWS开发出一套框架,帮助他们理解自身用例并实现商业价值。
    至顶网  至顶网CIO与CTO频道  2022-03-11 11:01:30  
  • 并联扩展:在不增加参数的情况下提升大模型能力的全新方法 - 阿里巴巴钱文团队揭示并联计算缩放定律

    由阿里巴巴钱文团队与浙江大学合作的研究提出了"并联缩放"(ParScale)方法,一种全新的大语言模型能力提升策略。不同于增加参数或延长推理时间的传统方法,ParScale通过多路并行计算来提升模型性能:它使模型同时从多个角度处理同一输入,再智能整合结果。研究表明,P倍并行计算相当于增加O(log P)倍参数,但内存和延迟开销显著降低。对于1.6B参数模型,8路并行可节省22倍内存增长和6倍延迟增长。更重要的是,此方法可应用于现有模型,通过少量数据的后训练即可实现性能提升,为资源受限场景下部署强大AI提供新思路。
    至顶网  科技行者  2025-05-20 18:07:10  
  • 阿里巴巴等机构提出SingLoRA:用一个矩阵就能让AI模型学会新技能的神奇方法

    这项由以色列理工学院等机构完成的研究提出了SingLoRA方法,用单一矩阵替代传统LoRA的双矩阵设计,解决了AI模型微调中的稳定性问题。该方法在保持性能的同时将参数量减少一半,在语言理解和图像生成任务中都表现出色,为大模型的高效适应提供了新的解决思路。
    至顶网  科技行者  2025-07-18 09:34:36  
  • 中国柔性制造之父吴怀宇:3D智能数字化是解决柔性的关键

    被业界誉为“中国柔性制造之父”的吴怀宇博士多年来带领三体科技团队经过长期的研发攻关在柔性制造技术领域已取得了突破性进展,特别是在柔性制造技术难度最大的鞋服无人制造领域取得了领先国际同行的颠覆性成果。
    至顶网  业界供稿  2022-11-25 10:42:08  
  • 揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

    CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户能够审计隐藏令牌而不暴露专有内容。实验表明,即使面对复杂攻击,CoIn的检测成功率高达94.7%,为商业AI服务提供了前所未有的计费透明度。
    至顶网  科技行者  2025-05-27 10:11:23  
  • 英特尔加码云计算,多维助推“东数西算”落地

    与“西气东输”“西电东送”“南水北调”等超级工程类似,“东数西算”实施之路也荆棘丛生,该如何解决这些遇到的阻力和挑战呢?
    至顶网  业界供稿  2022-06-08 18:04:15  
  • 一加十周年力作:一加12旗舰产品上市 售价4299元起

    一加中国区总裁李杰表示:“一加 12 将所有用户高频使用场景的体验均做到极致,产品力超越了所有骁龙 8Gen3 的旗舰 Pro 版,真正实现了「一部,即全部」,是一加十周年送给用户最好的礼物。”
    至顶网  业界供稿  2023-12-06 12:00:54  
  • 让AI炒股变得更聪明:哈佛大学等团队发明的"智能交易员"如何用对话模式赚钱

    这是一项融合大语言模型与强化学习的金融交易AI创新研究。哈佛等知名院校团队开发的FLAG-TRADER系统让仅1.35亿参数的小型AI模型在股票和加密货币交易中超越了GPT-4等大型商业模型。该系统通过部分微调和夏普比率奖励机制,实现了既能理解复杂市场信息又能从交易实践中持续学习的智能交易决策,为AI在金融领域的应用开辟了新路径。
    至顶网  科技行者  2025-08-20 18:05:38  
  • 加速扩散大语言模型:UCLA研究团队提出自适应并行解码新方法

    UCLA计算机科学系研究团队提出的"自适应并行解码"(APD)方法,成功解决了扩散大语言模型面临的速度与质量权衡难题。该方法通过动态调整并行生成的词数,结合一个小型辅助自回归模型来评估生成质量,并引入KV缓存和掩码输入限制等优化措施,使扩散模型能在保持高质量输出的同时显著提升生成速度。实验表明,使用APD的Dream 7B模型不仅能达到每秒59个词的吞吐量(比基线提升近6倍),还在数学推理等任务上保持了接近原始水平的准确率,甚至超越了传统自回归模型的速度。
    至顶网  科技行者  2025-06-06 17:25:16  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号