搜一下
用了 0.127004秒,为您找到
宝马
棋牌
官方网站
全部
版本
網纸
YB233
相关内容10446 条
微软首创!让大型语言模型记忆力暴涨64倍的神奇方法
微软研究院开发出LongRoPE2技术,能让大型语言模型的记忆容量扩展64倍至12.8万字,同时保持98.5%的原有性能。该方法通过发现AI位置编码训练不均衡问题,采用智能搜索和混合训练策略,仅用传统方法八十分之一的资源就实现突破。这项技术将使AI能完整处理长文档、进行复杂对话,为文档分析、代码开发、内容创作等领域带来重大改进。
至顶网
科技行者 2025-08-21 10:02:53
Trinity-RFT:阿里巴巴开源的通用强化微调框架,让大语言模型拥有"经验学习"能力
Trinity-RFT是阿里巴巴团队开发的开源框架,专为大语言模型的强化微调设计。它采用三位一体结构,包含RFT核心(探索者、训练者和缓冲区)、智能体-环境交互和数据流水线三大核心组件。框架支持同步/异步、在线/离线和策略内/外等多种训练模式,能优雅处理复杂的现实场景如延迟反馈和环境失败。Trinity-RFT还提供了丰富的数据处理功能和人机协作界面,并通过Trinity-Studio实现无代码操作。
至顶网
科技行者 2025-05-29 08:18:59
性能直逼高端,IDC完整点评PowerStore
随企业数字化转型的不断深入,他们正在快速对现有IT基础设施结构进行现代化改造。IDC在2020年进行的研究表明,在那些正在进行数字化转型的组织中,有68.2%的组织正在更新存储基础设施。
至顶网
戴尔 2020-05-18 16:44:08
GSMA王建宙:5G创新推动数字化转型
数字化转型驱动生产方式、生活方式和治理方式的变革,促进经济高质量发展。5G的应用有力地推动了数字化转型。
至顶网
业界供稿 2021-12-08 09:14:05
华为团队打造AI训练"流水线":让大模型学习效率提升一倍的秘密武器
华为研究团队提出AsyncFlow框架,通过TransferQueue数据管理模块和异步工作流优化,解决大语言模型强化学习训练中的效率瓶颈。该系统实现了平均1.59倍的吞吐量提升,支持多种训练引擎,为大规模AI模型后训练提供了高效可扩展的解决方案。
至顶网
科技行者 2025-07-04 17:44:19
熬过了40+危机的程序员,向AI开战
写代码的人,被代码替代……
至顶网
杨淼 2024-10-24 10:33:47
清华大学团队突破大模型指令遵循难题:让AI像侦探一样精准验证每个要求
清华大学研究团队提出VERIF方法,通过结合代码验证和大语言模型验证解决AI指令遵循中的验证难题。该方法构建22000实例数据集VERINSTRUCT,将约束分为硬性和软性两类分别处理,在多个基准测试中显著提升模型性能,同时保持通用能力不下降,为强化学习训练提供可靠验证机制。
至顶网
科技行者 2025-06-17 12:36:12
对话Neo4j亚太区副总裁:用数据的关系理解世界
Neo4j官网就有一句话恰当地概括图数据库的价值——“We Help the World Make Sense of Data(我们帮助世界理解数据)。”这就是为什么Nik Vora说:“图数据库的美妙之处在于,它基本上适合于每一个行业。”
至顶网
周雅 2021-08-18 12:04:58
高通研究院让AI语言模型开口说话也能省电费:词汇表"瘦身"技术让智能回复又快又节能
高通研究院提出VOCABTRIM技术,通过分析AI实际词汇使用模式,将推测性解码中草稿模型的词汇表从12万个精简至2-3万个高频词汇,在保持生成质量的同时显著提升内存受限环境下的推理速度,为Llama-3模型带来16%的性能提升。
至顶网
科技行者 2025-07-02 11:37:00
华为云张鹏:专属月为“互联网”打造了一个“新价值连接器”
10月15日,华为云举办了“华为云专属月·行业深耕”发布会,开启了2021年的专属月行动。其中包括1.3亿元上云津贴,为互联网企业,特别是电商、游戏、移动出行行业提供多类型、多组合、高频场景的专属商务政策等云产品及服务,成为互联网企业连接未来的桥梁。
至顶网
业界供稿 2021-11-16 17:00:42
社交AI也能拥有情商?卡内基梅隆大学团队的突破性训练方法让机器人学会察言观色
卡内基梅隆大学等高校研究团队开发出SOTOPIA-RL框架,首次成功训练AI掌握复杂社交技能。该方法通过逐句精细评分和多维度评估,让AI学会在对话中平衡目标达成、关系维护和知识获取。测试显示AI社交表现大幅提升,在困难场景中达成率提升至8.31分,为开发更智能的AI客服、教育和医疗助手奠定基础。
至顶网
科技行者 2025-08-11 14:28:23
高通侯明娟:加深与广东省和大湾区合作 共同推动创新驱动的高质量经济发展
本次论坛围绕推动全球半导体产业合作发展、建设粤港澳大湾区国际科技创新中心等话题,邀请多位政府、产业界、跨国公司的重要嘉宾共商合作经验,共话模式创新,共促全球半导体产业走向更高水平的开放合作。
至顶网
科技行者 2021-11-07 11:20:44
IBM量子安全技术:保护数据不被下一代量子计算机破解
量子计算机或将给密码学乃至企业、社会和政府的财务构成重大威胁。
至顶网
至顶网软件与服务频道 2023-05-15 10:30:38
英特尔加码云计算,多维助推“东数西算”落地
与“西气东输”“西电东送”“南水北调”等超级工程类似,“东数西算”实施之路也荆棘丛生,该如何解决这些遇到的阻力和挑战呢?
至顶网
业界供稿 2022-06-08 18:04:15
OCP China Day 2019: 开放计算浪潮下OCP的坚守与变革
数据经济不断发展,业界对于算力的需求不断激增。数据中心的作用变得举足轻重,OCP聚焦开放计算,通过协作创新,赋予开放计算更多使命,推动整个计算产业的发展。展望未来,OCP的发展值得期待。
至顶网
李祥敬 2019-07-02 08:34:07
飞腾总经理窦强:20年CPU之路,做新时代的攀登者
CPU只有方寸大小,却足以撼动世界。在国内CPU研发之路上,飞腾公司有着浓墨重彩的一笔。今天,也是飞腾CPU首届生态合作伙伴大会召开的日子。
至顶网
黄当当 2019-12-19 17:20:02
关键时刻做减法,HUAWEI CONNECT上聚焦计算,发布全球最快AI训练集群
今天,第四届华为全联接大会HUAWEI CONNECT2019在上海世博展览馆举办。
至顶网
任新勃 2019-09-18 10:14:41
FastTD3:简单、快速且强大的人形机器人强化学习算法——加州大学伯克利分校的革命性研究
这项研究介绍了FastTD3,一种简单却高效的强化学习算法,能显著加速人形机器人的训练过程。由加州大学伯克利分校团队开发,FastTD3通过四个关键优化——并行模拟、大批量更新、分布式评论家网络和精心调整的超参数,在不到3小时内解决了复杂的人形机器人控制任务,并成功实现了从模拟到实体机器人的技能迁移,为机器人学习研究提供了宝贵的开源工具。
至顶网
科技行者 2025-06-03 09:46:13
差分信息:一种信息论视角下理解偏好优化的新方法 - KAIST AI研究团队突破性解读
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
至顶网
科技行者 2025-06-03 20:42:00
高端引领 聚浪成潮 浪潮商用机器2023合作伙伴峰会全国巡展火热进行中
未来,随着渠道新政策实施落地,浪潮K1 Power生态将进一步壮大,浪潮商用机器携手渠道生态伙伴持续稳固核心应用市场的同时,不断提高私有云、行业云、混合云及分布式存储等创新应用市场份额,合力创新,打造共赢格局。
至顶网
业界供稿 2023-04-03 17:42:18
<
上一页
471
472
473
474
475
476
477
478
479
480
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号