搜一下
用了 0.045788秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3162 条
OREAL算法:从7B模型首破91分到32B新纪录,上海AI实验室如何用强化学习让AI数学推理超越OpenAI o1?
上海AI实验室团队开发的OREAL算法在数学推理领域实现重大突破,7B模型首次通过强化学习在MATH-500测试中达到91分,32B模型更创下95分新纪录,超越OpenAI o1系列。该算法通过正确样本行为克隆、奖励重塑和词级重要性评估三大创新,有效解决了稀疏奖励下的强化学习难题,证明了巧妙算法设计胜过简单规模扩张的AI发展新思路。
至顶网
科技行者 2025-08-22 15:09:36
Jetbot系列09-用键盘与摇杆控制行动
如果已经将Jetbot智能小车组装好的话,现在就可以开始执行Jetbot提供的实验,在接下来的操作都在以下环境中执行。
至顶网
业界供稿 2022-01-18 14:34:52
AI治理工作中的四大重要经验
总部于位于得克萨斯州奥斯汀的软件公司Planview从18个月前起,就开始使用生成式AI提升生产效率。在此期间,他们还尝试将生成式AI整合进自己的产品当中,构建起可供用户交互的copilot服务,用于支持战略投资组合与价值流管理。
至顶网
至顶网软件与服务频道 2024-07-05 14:48:31
后疫情时代下,中小企业混合办公如何守护数据安全?
Veritas建议中小企业可以在混合办公常态下实施五个关键措施,以加强数据保护,并通过转变企业文化来改变用户行为。
至顶网
至顶网存储频道 2022-06-30 11:16:58
闪迪大师系列存储设备:加速数字化影视进程 影视工作者的好帮手
目前的视频基本已经开始全面普及4K、8K,视频文件的容量
大小
也在暴涨,对于后期内容创作者来讲,需要速度更快、容量更大的存储,同时在素材的安全性方面,也需要相对应的更专业、可靠的解决方案。
至顶网
业界供稿 2022-08-24 16:10:20
数学推理的新突破:NVIDIA与清华大学联手打造的"负例感知微调"如何弥合监督学习与强化学习的鸿沟
这项由清华大学与NVIDIA合作的研究提出了"负例感知微调"(NFT)算法,挑战了"自我提升仅适用于强化学习"的传统观念。通过构建隐式负面策略处理错误答案,NFT在数学推理任务上匹配甚至超越了顶尖强化学习算法的表现。研究不仅证明了监督学习与强化学习在特定条件下的等价性,还展示了如何利用负面反馈显著提升大语言模型的数学能力,为AI训练方法论开辟了新视角。
至顶网
科技行者 2025-05-30 14:41:39
当你的母语说不出口:解锁AI多语言思维的权衡与挑战
格罗宁根大学和哈佛大学的研究团队发现,当前大型推理模型在被要求用非英语语言"思考"时,面临严重的语言匹配与准确性权衡。他们通过评估六个先进模型,揭示即使最强大的32B参数模型也经常默认使用英语推理,而非用户指定的语言。提示黑客技术能将语言匹配率从45%提高到90%以上,但准确率会下降。这一发现对构建真正可信的多语言AI系统具有重要启示。
至顶网
科技行者 2025-06-04 09:16:03
戴尔PowerScale 高性价比的医学影像存储扩展平台
随着医学图像的密度和体积以指数级速度增长,医疗保健机构需要一个面向未来的解决方案,以高性能、高可用性、大规模可伸缩性和卓越的数据保护满足现代医疗保健应用程序的需求。
至顶网
戴尔 2022-07-20 16:31:42
英属哥伦比亚大学团队重磅发现:AI智能体终于学会了"过目不忘",记忆系统自我进化实现质的飞跃
英属哥伦比亚大学团队开发了ALMA系统,让AI智能体能够自主设计最适合的记忆架构,突破了传统人工设计记忆系统的局限。该系统在四个测试环境中全面超越人工基线,平均性能提升6.2%-12.8%,展现出更高的学习效率和适应性,为开发能够持续学习的通用AI系统奠定了重要基础。
至顶网
科技行者 2026-02-12 13:31:37
如何从“不确定性”中寻找“确定”?这场亚马逊云科技的创业者之日,错过了还要再等一年
正如管理大师彼得·德鲁克所说:在动荡的时代,动荡本身并不可怕,可怕的是延续过去的逻辑。也就是说,“创新”将成为应对当下“不确定性”中唯一“确定”的方法论。
至顶网
至顶网云计算频道 2022-09-30 20:23:01
中国香港大学团队开发"学习小助手":让自主学习变得像玩游戏一样简单
中国香港中文大学(深圳)研究团队开发了SRLAgent智能学习系统,通过Minecraft游戏环境结合AI助手帮助大学生培养自主学习能力。实验显示该系统能显著提升学生的学习规划和过程监控能力,但也发现过度AI支持可能产生依赖性,提出需要平衡支持与独立能力培养的重要性。
至顶网
科技行者 2025-06-20 11:05:00
加速下一代客户端设备 莱迪思Lattice sensAI 4.1版本正式发布
莱迪思半导体公司宣布Lattice sensAI 4.1版本正式发布。借助Lattice sensAI解决方案,OEM厂商可以开发智能、实时在线、具有低功耗和硬件加速AI功能的设备,这些设备还能现场进行升级,支持未来更多的AI算法。
至顶网
李祥敬 2021-11-30 16:09:58
金融行业解锁ChatGPT玩法,成率先“吃螃蟹者”
ChatGPT撞上金融圈,抢活还是助攻?
至顶网
于佳卉 2023-03-29 14:15:04
至顶智库 | 图文并茂万字解读DeepSeek核心技术概念
至顶智库万字解读DeepSeek-V3和R1模型技术概念及产业影响。
至顶网
至顶智库 2025-02-17 18:52:24
五位数字化专家畅谈:当CIO转变为首席整合官和首席影响力官
随着数字化计划的蓬勃发展,CIO是组织中少数几位能够鸟瞰所有业务职能以及他们如何在更广泛组织环境(包括数字化进程、能力、挑战和人才)中工作的高管之一。
至顶网
至顶网CIO与CTO频道 2022-11-03 10:09:16
中国工程院院士吴志强:AI2.0赋能上海数字化转型
中国工程院院士、同济大学副校长吴志强参与了“城市智能体”的发布,并发表了“AI 2.0赋能上海数字化转型”主题演讲。
至顶网
至顶网人工智能频道 2020-12-18 18:14:27
微软Build 2024:Azure生成式AI开发工具库获得大量更新
微软近日对其开发者工具进行了大量更新,试图让生成式AI开发者的工作更轻松。
至顶网
至顶网软件与服务频道 2024-05-23 11:33:26
揭秘Scaling Law背后的“中国基因”:助推OpenAI成功的隐秘推手居然是它
Scaling Law”,是指在深度学习中,增大数据量和模型参数能让模型性能指标提升,这种提升并非线性,而是遵循一种幂律关系。
至顶网
大模型之家 2025-01-02 11:04:36
百分点完成E轮5亿融资,为公司AI布局提供新动能
日前,百分点在京召开了以“无界智能”为主题的新产品暨E轮融资发布会,宣布完成5亿人民币E轮融资。此外,百分点还宣布成立认知智能实验室,并发布首个行业AI决策系统 DeepMatrix的2.0版本,为客户提供更深入和广泛的行业应用价值。
至顶网
邹大斌 2018-12-10 12:39:19
StepFun团队发布NextStep-1:让机器像人类一样逐步生成图像的新突破
StepFun团队发布的NextStep-1代表了AI图像生成领域的重要突破,采用自回归方式逐步生成图像,像艺术家作画般一点点构建视觉内容。这个14B参数的模型在多项测试中表现优异,不仅能高质量生成图像,还具备强大的编辑能力,为AI创作工具的发展开辟了新方向。
至顶网
科技行者 2025-08-19 10:19:29
<
上一页
76
77
78
79
80
81
82
83
84
85
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号