搜一下
用了 0.024661秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容1228 条
DanceGRPO:一场视觉生成领域的"舞蹈革命"
生成式AI的世界近年来经历了翻天覆地的变化。特别是在图像和视频生成领域,扩散模型(diffusion models)和整流流模型(rectified flows)的出现,极大地提升了AI生成内容的质量和多样性。这些模型就像是拥有惊人创造力的艺术家,能够根据文字描述创作出令人惊叹的图像或视频。
至顶网
科技行者 2025-05-14 16:33:15
从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇配方
StepFun和清华大学联合提出Open-Reasoner-Zero,这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练,无需复杂预处理,仅用十分之一训练时间就在多个数学推理基准上超越了DeepSeek-R1-Zero。研究证明了简单方法在AI推理训练中的强大潜力。
至顶网
科技行者 2025-07-16 09:16:11
香港中文大学团队让AI学会画图:从文字到精美矢量图的创作之路
香港中文大学团队开发出让AI学会矢量图形编程的创新方法,通过强化学习和跨模态奖励机制,成功将开源模型的绘图能力提升到商业级水平。研究建立了SGP-GenBench评估体系,发现AI不仅学会精确绘图,还发展出分层构建、创意补充等智能行为模式,为AI辅助设计开辟新路径。
至顶网
科技行者 2025-09-23 13:38:07
在数字时代提高IT弹性的7个
技巧
大多数时候,IT弹性一直是关于正常运行时间、确保系统不出故障,如果出现故障,需要尽快让系统恢复在线。作为咨询公司Booz Allen Hamilton的CIO,Brad Stone表示,从两个方面考虑IT弹性:一是让业务不受干扰;二要有调整、应对变化和应对突发事件的能力。
至顶网
至顶网CIO与CTO频道 2022-07-14 10:22:09
实时、可交互的流体模拟:北京交通大学与西蒙弗雷泽大学联合推出神经-MPM混合方法
北京交通大学与西蒙弗雷泽大学联合研发的混合神经-MPM方法实现了实时交互式流体模拟。该方法巧妙结合神经物理学与传统数值求解器,在低时空分辨率下运行神经网络并设置保障机制自动切换到MPM,显著降低计算延迟同时保持高保真度。团队还设计了基于扩散模型的控制器,支持用户通过简单草图直观控制流体行为,为游戏、VR和设计领域提供了实用解决方案。
至顶网
科技行者 2025-05-30 11:46:08
停用ChatGPT默认设置:7个调整让它成为专业工具
ChatGPT自2022年推出以来已大幅改进。除了AI模型本身的提升,其聊天功能也变得更加全面。本文介绍7个实用的设置调整
技巧
:包括自定义界面外观、选择合适的AI模型、调整个性化风格、设置用户信息、管理记忆功能、固定重要对话以及控制广告显示。这些设置可以帮助用户根据自己的工作需求和使用习惯,将ChatGPT从基础聊天工具升级为更专业、更个性化的AI助手。
至顶网
ZDNET 2026-02-12 10:10:30
麻省大学安姆赫斯特分校研究团队打造"有记忆的社交机器人":Ella能在虚拟社区中学习、交友并影响他人
麻省大学安姆赫斯特分校等机构联合开发了名为Ella的虚拟社交机器人,它拥有类似人类的长期记忆系统,能在3D虚拟社区中学习、社交和适应。实验显示,Ella在说服他人参加聚会和领导团队完成任务方面表现卓越,成功率分别达到53.4%和32.5%,远超其他方法。这项研究为开发能与人类真正共存的智能体奠定了基础。
至顶网
科技行者 2025-07-04 10:19:29
揭秘指令特定神经元与专家:一个分析LLM指令跟随能力的全新框架
这项由香港科技大学研究团队开展的创新研究揭示了大型语言模型(LLM)执行指令能力背后的神经机制。研究者通过提出SPARCOM分析框架,成功识别并分析了"指令特定神经元"和"指令特定专家"这两类稀疏组件在模型内部的分布与功能。通过精心设计的HEXAINST数据集,研究发现这些组件不仅具有功能通用性和独特性,而且在模型微调过程中发生显著变化。研究结果表明,模型的指令执行能力主要源于这些稀疏组件的精确激活,为理解LLM内部工作机制提供了新视角,对构建更可靠的AI系统具有重要指导意义。
至顶网
科技行者 2025-06-02 12:19:32
索尼推出“出发!探索编程世界(TM)教育版”及toio 教育教学解决方案
北京——索尼(中国)有限公司教育事业部(下称:索尼)正式推出专为幼儿园、小学及教育机构打造的无屏编程教育套件——“出发!探索编程世界(TM) 教育版
至顶网
至顶网人工智能频道 2023-07-13 16:25:16
MiroMind发布M1系列:会思考的AI数学天才是如何炼成的
MiroMind AI公司发布了完全开源的M1系列数学推理模型,采用创新的CAMPO算法实现分阶段训练和重复惩罚机制。该模型在AIME24、AIME25等权威测试中表现优异,不仅准确率高且推理过程简洁高效。研究团队公开了全部训练数据、代码和配置,为AI推理研究提供了完整的开源解决方案,展现了与商业封闭模式不同的发展路径。
至顶网
科技行者 2025-07-25 11:45:02
斯坦福AI突破:让机器像人类一样学会"举一反三"的神奇能力
斯坦福大学研究团队开发出概念组合学习框架,让AI系统像人类一样学会"举一反三"。该技术将复杂学习任务分解为基础概念模块,通过灵活组合处理新任务,学习效率比传统方法提高10倍。实验显示在多概念组合任务中准确率达78%,并具备跨领域迁移能力。这项突破为通用人工智能发展奠定重要基础,预计将在医疗、教育、自动驾驶等领域率先应用。
至顶网
科技行者 2025-09-28 13:49:11
中科大研究团队打造语音AI"大考场":让机器说话不再是简单模仿,而是真正理解人类情感的艺术
中科大研究团队创建了S2S-Arena平台,这是首个专门评测语音AI情感理解和表达能力的综合测试系统。通过154个测试样本和人工评判,研究发现GPT-4o在语音情感理解方面表现出色,但所有AI在情感表达上仍有很大提升空间,为语音AI发展指明了新方向。
至顶网
科技行者 2025-07-31 11:26:10
浙大团队破解AI大模型"教学相长"难题:让机器老师和学生同时进步
浙江大学团队开发的Cooper框架实现了AI训练中的"教学相长",通过同步优化策略模型和奖励模型,成功解决了传统训练中的奖励黑客攻击问题。该框架让AI老师和学生同步成长,在数学推理任务上实现了显著性能提升,为构建更稳定可靠的AI系统开辟了新路径。
至顶网
科技行者 2025-08-18 10:17:59
让大型AI模型减肥变身,马普所等机构打造"瘦身"版训练新方法
德国马普所等机构提出OFTv2,一种更高效的AI模型训练方法。通过将计算从"权重中心"转为"输入中心",结合Cayley-Neumann参数化技术,实现了10倍训练加速和3倍内存节省。该方法还扩展到量化模型训练,创造了QOFT框架,在数学推理等任务上超越了流行的QLoRA方法,为大型AI模型的高效训练提供了新方案。
至顶网
科技行者 2025-06-30 10:51:29
Skywork OR1: 昆仑团队打造的增强推理能力开源大模型
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
至顶网
科技行者 2025-06-02 16:33:24
MIT新发现:AI画画的"局部思维"其实来源于训练数据的像素关联性,而非网络结构本身
MIT研究团队发现,AI图像生成模型的"局部思维"并非来自网络结构限制,而是源于训练数据中像素间的统计关联。通过巧妙实验证明,即使改变数据中的微妙模式,AI也会相应调整注意力策略。这一发现为开发更可解释、高效的AI系统提供了新思路,并揭示了数据质量在AI发展中被低估的重要性。
至顶网
科技行者 2025-09-28 10:59:47
拆解界面,组合交互:香港大学和Salesforce AI的创新研究让电脑操作模型更精准
这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍:GUI定位能力。研究者创建了新的OSWORLD-G基准测试(564个样本)和JEDI数据集(400万示例),通过将复杂界面交互分解为基础组件重新训练模型。实验证明这种方法大幅提升了AI在精确操作计算机方面的能力,使OSWorld基准测试成功率从5%提高到27%,为构建更自然的人机交互系统奠定了基础。
至顶网
科技行者 2025-05-22 08:25:24
ChARM:角色扮演型AI助手的突破性进步——让AI角色更加真实可信
这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了13%的偏好排名准确率,应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。
至顶网
科技行者 2025-06-05 09:34:00
阿里CEO吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
机器人将是下一个迎来巨变的行业。
至顶网
至顶网云计算频道 2024-09-19 11:20:47
OREAL算法:从7B模型首破91分到32B新纪录,上海AI实验室如何用强化学习让AI数学推理超越OpenAI o1?
上海AI实验室团队开发的OREAL算法在数学推理领域实现重大突破,7B模型首次通过强化学习在MATH-500测试中达到91分,32B模型更创下95分新纪录,超越OpenAI o1系列。该算法通过正确样本行为克隆、奖励重塑和词级重要性评估三大创新,有效解决了稀疏奖励下的强化学习难题,证明了巧妙算法设计胜过简单规模扩张的AI发展新思路。
至顶网
科技行者 2025-08-22 15:09:36
<
上一页
20
21
22
23
24
25
26
27
28
29
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号