搜索快三大小单双技巧集锦【罔芷:——88pk·ee—

DanceGRPO：一场视觉生成领域的"舞蹈革命"

生成式AI的世界近年来经历了翻天覆地的变化。特别是在图像和视频生成领域，扩散模型（diffusion models）和整流流模型（rectified flows）的出现，极大地提升了AI生成内容的质量和多样性。这些模型就像是拥有惊人创造力的艺术家，能够根据文字描述创作出令人惊叹的图像或视频。

至顶网科技行者 2025-05-14 16:33:15

从零起步也能做推理大模型？StepFun和清华大学揭秘超高效训练的神奇配方

StepFun和清华大学联合提出Open-Reasoner-Zero，这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练，无需复杂预处理，仅用十分之一训练时间就在多个数学推理基准上超越了DeepSeek-R1-Zero。研究证明了简单方法在AI推理训练中的强大潜力。

至顶网科技行者 2025-07-16 09:16:11

香港中文大学团队让AI学会画图：从文字到精美矢量图的创作之路

香港中文大学团队开发出让AI学会矢量图形编程的创新方法，通过强化学习和跨模态奖励机制，成功将开源模型的绘图能力提升到商业级水平。研究建立了SGP-GenBench评估体系，发现AI不仅学会精确绘图，还发展出分层构建、创意补充等智能行为模式，为AI辅助设计开辟新路径。

至顶网科技行者 2025-09-23 13:38:07

在数字时代提高IT弹性的7个技巧

大多数时候，IT弹性一直是关于正常运行时间、确保系统不出故障，如果出现故障，需要尽快让系统恢复在线。作为咨询公司Booz Allen Hamilton的CIO，Brad Stone表示，从两个方面考虑IT弹性：一是让业务不受干扰；二要有调整、应对变化和应对突发事件的能力。

至顶网至顶网CIO与CTO频道 2022-07-14 10:22:09

实时、可交互的流体模拟：北京交通大学与西蒙弗雷泽大学联合推出神经-MPM混合方法

北京交通大学与西蒙弗雷泽大学联合研发的混合神经-MPM方法实现了实时交互式流体模拟。该方法巧妙结合神经物理学与传统数值求解器，在低时空分辨率下运行神经网络并设置保障机制自动切换到MPM，显著降低计算延迟同时保持高保真度。团队还设计了基于扩散模型的控制器，支持用户通过简单草图直观控制流体行为，为游戏、VR和设计领域提供了实用解决方案。

至顶网科技行者 2025-05-30 11:46:08

停用ChatGPT默认设置：7个调整让它成为专业工具

ChatGPT自2022年推出以来已大幅改进。除了AI模型本身的提升，其聊天功能也变得更加全面。本文介绍7个实用的设置调整技巧：包括自定义界面外观、选择合适的AI模型、调整个性化风格、设置用户信息、管理记忆功能、固定重要对话以及控制广告显示。这些设置可以帮助用户根据自己的工作需求和使用习惯，将ChatGPT从基础聊天工具升级为更专业、更个性化的AI助手。

至顶网 ZDNET 2026-02-12 10:10:30

麻省大学安姆赫斯特分校研究团队打造"有记忆的社交机器人"：Ella能在虚拟社区中学习、交友并影响他人

麻省大学安姆赫斯特分校等机构联合开发了名为Ella的虚拟社交机器人，它拥有类似人类的长期记忆系统，能在3D虚拟社区中学习、社交和适应。实验显示，Ella在说服他人参加聚会和领导团队完成任务方面表现卓越，成功率分别达到53.4%和32.5%，远超其他方法。这项研究为开发能与人类真正共存的智能体奠定了基础。

至顶网科技行者 2025-07-04 10:19:29

揭秘指令特定神经元与专家：一个分析LLM指令跟随能力的全新框架

这项由香港科技大学研究团队开展的创新研究揭示了大型语言模型（LLM）执行指令能力背后的神经机制。研究者通过提出SPARCOM分析框架，成功识别并分析了"指令特定神经元"和"指令特定专家"这两类稀疏组件在模型内部的分布与功能。通过精心设计的HEXAINST数据集，研究发现这些组件不仅具有功能通用性和独特性，而且在模型微调过程中发生显著变化。研究结果表明，模型的指令执行能力主要源于这些稀疏组件的精确激活，为理解LLM内部工作机制提供了新视角，对构建更可靠的AI系统具有重要指导意义。

至顶网科技行者 2025-06-02 12:19:32

索尼推出“出发！探索编程世界(TM)教育版”及toio 教育教学解决方案

北京——索尼（中国）有限公司教育事业部（下称：索尼）正式推出专为幼儿园、小学及教育机构打造的无屏编程教育套件——“出发！探索编程世界(TM) 教育版

至顶网至顶网人工智能频道 2023-07-13 16:25:16

MiroMind发布M1系列：会思考的AI数学天才是如何炼成的

MiroMind AI公司发布了完全开源的M1系列数学推理模型，采用创新的CAMPO算法实现分阶段训练和重复惩罚机制。该模型在AIME24、AIME25等权威测试中表现优异，不仅准确率高且推理过程简洁高效。研究团队公开了全部训练数据、代码和配置，为AI推理研究提供了完整的开源解决方案，展现了与商业封闭模式不同的发展路径。

至顶网科技行者 2025-07-25 11:45:02

斯坦福AI突破：让机器像人类一样学会"举一反三"的神奇能力

斯坦福大学研究团队开发出概念组合学习框架，让AI系统像人类一样学会"举一反三"。该技术将复杂学习任务分解为基础概念模块，通过灵活组合处理新任务，学习效率比传统方法提高10倍。实验显示在多概念组合任务中准确率达78%，并具备跨领域迁移能力。这项突破为通用人工智能发展奠定重要基础，预计将在医疗、教育、自动驾驶等领域率先应用。

至顶网科技行者 2025-09-28 13:49:11

中科大研究团队打造语音AI"大考场"：让机器说话不再是简单模仿，而是真正理解人类情感的艺术

中科大研究团队创建了S2S-Arena平台，这是首个专门评测语音AI情感理解和表达能力的综合测试系统。通过154个测试样本和人工评判，研究发现GPT-4o在语音情感理解方面表现出色，但所有AI在情感表达上仍有很大提升空间，为语音AI发展指明了新方向。

至顶网科技行者 2025-07-31 11:26:10

浙大团队破解AI大模型"教学相长"难题：让机器老师和学生同时进步

浙江大学团队开发的Cooper框架实现了AI训练中的"教学相长"，通过同步优化策略模型和奖励模型，成功解决了传统训练中的奖励黑客攻击问题。该框架让AI老师和学生同步成长，在数学推理任务上实现了显著性能提升，为构建更稳定可靠的AI系统开辟了新路径。

至顶网科技行者 2025-08-18 10:17:59

让大型AI模型减肥变身，马普所等机构打造"瘦身"版训练新方法

德国马普所等机构提出OFTv2，一种更高效的AI模型训练方法。通过将计算从"权重中心"转为"输入中心"，结合Cayley-Neumann参数化技术，实现了10倍训练加速和3倍内存节省。该方法还扩展到量化模型训练，创造了QOFT框架，在数学推理等任务上超越了流行的QLoRA方法，为大型AI模型的高效训练提供了新方案。

至顶网科技行者 2025-06-30 10:51:29

Skywork OR1: 昆仑团队打造的增强推理能力开源大模型

Skywork OR1是昆仑公司AI团队开发的开源推理大模型，通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列，采用名为MAGIC的训练方法，在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升，32B模型平均准确率提高15.0%，7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象，提出了有效的缓解策略，并开源了全部代码、数据和模型权重，为AI社区提供了宝贵资源。

至顶网科技行者 2025-06-02 16:33:24

MIT新发现：AI画画的"局部思维"其实来源于训练数据的像素关联性，而非网络结构本身

MIT研究团队发现，AI图像生成模型的"局部思维"并非来自网络结构限制，而是源于训练数据中像素间的统计关联。通过巧妙实验证明，即使改变数据中的微妙模式，AI也会相应调整注意力策略。这一发现为开发更可解释、高效的AI系统提供了新思路，并揭示了数据质量在AI发展中被低估的重要性。

至顶网科技行者 2025-09-28 10:59:47

拆解界面，组合交互：香港大学和Salesforce AI的创新研究让电脑操作模型更精准

这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍：GUI定位能力。研究者创建了新的OSWORLD-G基准测试（564个样本）和JEDI数据集（400万示例），通过将复杂界面交互分解为基础组件重新训练模型。实验证明这种方法大幅提升了AI在精确操作计算机方面的能力，使OSWorld基准测试成功率从5%提高到27%，为构建更自然的人机交互系统奠定了基础。

至顶网科技行者 2025-05-22 08:25:24

ChARM：角色扮演型AI助手的突破性进步——让AI角色更加真实可信

这项研究提出了ChARM，一种创新的角色扮演AI奖励建模框架，通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集，实验表明ChARM比传统模型提高了13%的偏好排名准确率，应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。

至顶网科技行者 2025-06-05 09:34:00

阿里CEO吴泳铭：AI最大的想象力不在手机屏幕，而是改变物理世界

机器人将是下一个迎来巨变的行业。

至顶网至顶网云计算频道 2024-09-19 11:20:47

OREAL算法：从7B模型首破91分到32B新纪录，上海AI实验室如何用强化学习让AI数学推理超越OpenAI o1？

上海AI实验室团队开发的OREAL算法在数学推理领域实现重大突破，7B模型首次通过强化学习在MATH-500测试中达到91分，32B模型更创下95分新纪录，超越OpenAI o1系列。该算法通过正确样本行为克隆、奖励重塑和词级重要性评估三大创新，有效解决了稀疏奖励下的强化学习难题，证明了巧妙算法设计胜过简单规模扩张的AI发展新思路。

至顶网科技行者 2025-08-22 15:09:36