搜索 ku游娱乐代理【網纸——YB233典CN—

约翰霍普金斯大学揭秘：AI为什么总是对外部建议"充耳不闻"？

约翰霍普金斯大学研究团队发现，即使给AI模型提供近乎完美的外部反馈，它们仍然无法完全吸收并达到理论最佳表现，这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型，发现所有模型都存在这一局限性，且主要原因是模型的反馈抗拒而非反馈质量问题，为AI自我改进研究指明了新方向。

至顶网科技行者 2025-06-19 16:59:50

蒙纳什大学新突破：让AI数学推理像侦探破案一样精准

蒙纳什大学研究团队提出了一套基于不确定性驱动的自动化过程奖励数据构建框架，解决了训练数学推理AI的关键难题。该方法通过识别AI推理中的不确定性来精准定位错误步骤，显著提高了数据标注效率，同时开发了两种创新的输出聚合策略，结合群体智慧与专家判断，在多个数学推理数据集上取得了显著的性能提升。

至顶网科技行者 2025-08-07 14:17:30

产业安全专家谈 | 从攻防两端视角看DDoS的应对策略

2020年可以说是DDoS这一“经典”攻击技术的复兴之年。受全球新冠疫情的重大影响，DDoS攻击的量级也在不断加大，业内遭受DDoS攻击的频率创下了新高。

至顶网业界供稿 2021-03-26 14:13:38

研究机构能否教会AI自主扩展科学研究？波士顿大学团队揭示代码智能体的"研究盲区"

这项研究首次系统评估了AI代码智能体在科学研究扩展方面的能力。研究团队设计了包含12个真实研究任务的REXBENCH基准，测试了九个先进AI智能体的表现。结果显示，即使最优秀的智能体成功率也仅为25%，远低于实用化要求，揭示了当前AI在处理复杂科学推理任务时的显著局限性。

至顶网科技行者 2025-07-03 10:02:07

谷歌在中国搞了场“寓教于乐”的大会：堆了无数demo，只为给“AI开发者”来点灵感

谷歌一直在强调用Gemini将AI践行到底，只不过这次在中国的内容，传递了很多特色故事，这些故事有谷歌的AI如何点亮中国传统文化，如何创造种类繁多的AI应用，以及更重要的，如何赋能中国开发者的成功出海。

至顶网周雅 2024-08-09 19:05:21

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

为什么选择做AI Agent？澜码科技创始人兼CEO周健的解释是：传统的系统是人适应机器，造成人成为数据的搬运工；今天有了大模型，我们有机会让机器去适应人，在这方面AI Agent前景广阔。

至顶网周雅 2024-01-16 13:31:26

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

为什么选择做AI Agent？澜码科技创始人兼CEO周健的解释是：传统的系统是人适应机器，造成人成为数据的搬运工；今天有了大模型，我们有机会让机器去适应人，在这方面AI Agent前景广阔。

至顶网周雅 2024-01-16 11:50:17

AI也会"看图说话"了！上海交大团队让机器视觉推理能力提升12%

这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效，转而采用GRPO强化学习训练法，构建了包含10万样本的VSI-100k数据集。最终，仅20亿参数的vsGRPO-2B模型性能提升12.1%并超越GPT-4o，证明了正确训练方法能够显著释放AI模型的空间理解潜力。

至顶网科技行者 2025-07-16 09:16:46

LLM循环助力：创建PARADEHATE数据集实现仇恨言论无毒化

这项研究创新性地利用大语言模型(LLM)代替人类标注者，创建了PARADEHATE数据集，用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美，随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示，在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异，证明LLM生成的数据可作为人工标注的高效替代方案，为创建更安全、更具包容性的在线环境提供了新途径。

至顶网科技行者 2025-06-05 18:02:59

记忆坚实的世界：斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发，他们设计了三种互补的记忆系统：短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性，解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明，该方法在视角回忆一致性和整体视频质量方面显著优于现有技术，为创建持续一致的虚拟世界铺平了道路。

至顶网科技行者 2025-06-09 16:59:05

InternVL3.5：上海AI实验室的多模态AI新突破，让机器像人一样理解图文世界

上海AI实验室发布的InternVL3.5是新一代开源多模态大语言模型，能够同时理解图像和文字内容。该系统采用级联强化学习技术，推理性能提升16%，并通过视觉分辨率路由器实现4倍推理加速。在36项基准测试中表现优异，最大模型在多学科推理任务中得分77.7，接近商业模型水平，支持GUI交互、多语言处理等功能。

至顶网科技行者 2025-09-01 15:53:20

研究推理的奖励模型：微软提出新方法让AI评判能力更上一层楼

微软研究院新提出的"奖励推理模型"(RRM)为大型语言模型开创了全新评估方式。传统奖励模型对所有问题使用统一计算资源，而RRM能像人类一样先进行推理思考再做判断，对复杂问题投入更多思考资源。研究团队通过强化学习框架训练模型自主发展推理能力，无需显式示例。实验证明RRM在多个基准测试上表现优异，能自适应扩展计算资源提升判断准确性。该研究为AI评估系统带来范式转变，使人工智能判断更接近人类思考过程。

至顶网科技行者 2025-05-26 08:09:01

贝壳研究院32B模型突破：用开源数据打造推理能力媲美超大模型的"小巧强兵"

贝壳找房开发的AM-Thinking-v1是一个32B参数的推理优化语言模型，完全基于开源数据训练。该模型在数学推理和代码生成任务上表现出色，AIME2024得分85.3，超越了671B的DeepSeek-R1，证明了通过精心设计的训练流程，中等规模密集模型也能达到超大模型的推理能力。

至顶网科技行者 2025-07-09 11:56:44

打破僵硬动作！南洋理工大学团队为人类视频补帧注入3D控制能力

南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI，一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程，解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息，并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集，包含2,614个视频片段及完整的人体标注。实验结果显示，PoseFuse3D-KI在PSNR上提升9%，LPIPS减少38%，显著超越现有方法。

至顶网科技行者 2025-06-07 09:52:35

约翰霍普金斯大学揭秘：AI为什么总是对外部建议"充耳不闻"？

蒙纳什大学新突破：让AI数学推理像侦探破案一样精准

产业安全专家谈 | 从攻防两端视角看DDoS的应对策略

研究机构能否教会AI自主扩展科学研究？波士顿大学团队揭示代码智能体的"研究盲区"

谷歌在中国搞了场“寓教于乐”的大会：堆了无数demo，只为给“AI开发者”来点灵感

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

AI也会"看图说话"了！上海交大团队让机器视觉推理能力提升12%

LLM循环助力：创建PARADEHATE数据集实现仇恨言论无毒化

记忆坚实的世界：斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

InternVL3.5：上海AI实验室的多模态AI新突破，让机器像人一样理解图文世界

研究推理的奖励模型：微软提出新方法让AI评判能力更上一层楼

贝壳研究院32B模型突破：用开源数据打造推理能力媲美超大模型的"小巧强兵"

打破僵硬动作！南洋理工大学团队为人类视频补帧注入3D控制能力

亚马逊云科技推出Amazon Q：重塑未来工作方式

亚马逊云科技推出Amazon Q：重塑未来工作方式

MIT和IBM联手创新：TANGO框架通过互促进方式强化大语言模型的推理能力

字节跳动MAGREF：革命性技术让你的照片变身栩栩如生的视频，还能保持多个人物与物体的精准特征

OpenAI GPT-5突破性安全架构：当AI学会"思考"后如何确保不越界

SVRPBench：MBZUAI研究团队打造的首个真实场景随机车辆路径规划基准测试平台