用了 0.018033秒,为您找到彩神 APP 官方 最高 代理 内部 邀请 码罔芷 YB266CN 驻测相关内容1607 条
  • 重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角

    本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学推理基准测试中,CDAS达到了46.77%的最高平均准确率,同时比竞争策略提高了2.33倍的计算效率。研究还证明了CDAS在代码生成任务和更大型模型上的有效性,为提升大型语言模型的推理能力提供了高效可靠的新方法。
    至顶网  科技行者  2025-05-29 14:50:15  
  • 让机器人像人类一样解读图像寓意:上海人工智能实验室开发出人类思维启发的图像理解框架

    这项研究提出了名为"Let Androids Dream"的创新框架,解决了多模态大语言模型在理解图像隐喻方面的核心难题——上下文缺失。通过模拟人类认知过程的三阶段系统(感知、搜索、推理),该框架即使使用轻量级GPT-4o-mini模型,也能在英语和中文图像寓意理解任务中达到最先进性能,在开放式问题上甚至超越GPT-4o模型36.7%。这一成果不仅推动了视觉-语言推理技术的发展,还为未来AI系统理解人类文化中的隐喻和象征提供了新方向。
    至顶网  科技行者  2025-05-28 18:28:12  
  • 美国国家技术信息服务局(NTIS)的AI应用探索

    为了释放数据分析和人工智能的力量,必须配合多管齐下的数据战略消除数据孤岛、迁出遗留系统并淘汰遗留系统,支持数据标准与跨机构信息共享。新兴与创新技术带来了前所未有的机会,帮助我们应对关键任务挑战,以高效、有效、快速且低成本方式提供服务。
    至顶网  至顶网软件与服务频道  2022-12-06 14:48:59  
  • DeepTheorem:腾讯突破性研究如何通过自然语言和强化学习提升大模型定理证明能力

    腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
    至顶网  科技行者  2025-06-03 15:18:36  
  • 约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

    约翰霍普金斯大学研究团队发现,即使给AI模型提供近乎完美的外部反馈,它们仍然无法完全吸收并达到理论最佳表现,这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型,发现所有模型都存在这一局限性,且主要原因是模型的反馈抗拒而非反馈质量问题,为AI自我改进研究指明了新方向。
    至顶网  科技行者  2025-06-19 16:59:50  
  • 产业安全专家谈 | 从攻防两端视角看DDoS的应对策略

    2020年可以说是DDoS这一“经典”攻击技术的复兴之年。受全球新冠疫情的重大影响,DDoS攻击的量级也在不断加大,业内遭受DDoS攻击的频率创下了新高。
    至顶网  业界供稿  2021-03-26 14:13:38  
  • 谷歌在中国搞了场“寓教于乐”的大会:堆了无数demo,只为给“AI开发者”来点灵感

    谷歌一直在强调用Gemini将AI践行到底,只不过这次在中国的内容,传递了很多特色故事,这些故事有谷歌的AI如何点亮中国传统文化,如何创造种类繁多的AI应用,以及更重要的,如何赋能中国开发者的成功出海。
    至顶网  周雅  2024-08-09 19:05:21  
  • 对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!

    为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
    至顶网  周雅  2024-01-16 13:31:26  
  • 对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!

    为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
    至顶网  周雅  2024-01-16 11:50:17  
  • LLM循环助力:创建PARADEHATE数据集实现仇恨言论无毒化

    这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
    至顶网  科技行者  2025-06-05 18:02:59  
  • 记忆坚实的世界:斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

    斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发,他们设计了三种互补的记忆系统:短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性,解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明,该方法在视角回忆一致性和整体视频质量方面显著优于现有技术,为创建持续一致的虚拟世界铺平了道路。
    至顶网  科技行者  2025-06-09 16:59:05  
  • 研究推理的奖励模型:微软提出新方法让AI评判能力更上一层楼

    微软研究院新提出的"奖励推理模型"(RRM)为大型语言模型开创了全新评估方式。传统奖励模型对所有问题使用统一计算资源,而RRM能像人类一样先进行推理思考再做判断,对复杂问题投入更多思考资源。研究团队通过强化学习框架训练模型自主发展推理能力,无需显式示例。实验证明RRM在多个基准测试上表现优异,能自适应扩展计算资源提升判断准确性。该研究为AI评估系统带来范式转变,使人工智能判断更接近人类思考过程。
    至顶网  科技行者  2025-05-26 08:09:01  
  • 打破僵硬动作!南洋理工大学团队为人类视频补帧注入3D控制能力

    南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
    至顶网  科技行者  2025-06-07 09:52:35  
  • 亚马逊云科技推出Amazon Q:重塑未来工作方式

    2023 年11月29日,亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q,这是一种新型生成式AI支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。
    至顶网  至顶网软件与服务频道  2023-11-29 17:25:02  
  • 亚马逊云科技推出Amazon Q:重塑未来工作方式

    2023 年11月29日,亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q,这是一种新型生成式AI支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。
    至顶网  科技行者  2023-11-29 17:15:11  
  • MIT和IBM联手创新:TANGO框架通过互促进方式强化大语言模型的推理能力

    麻省理工学院与IBM研究团队共同开发的TANGO框架通过强化学习同时训练大语言模型的生成器和验证器,实现双向互促进的能力提升。不同于传统方法使用固定验证器,TANGO的验证器随生成器共同演进,提供精确的步骤级反馈。实验证明,这种"探戈式"协作方式使模型在数学竞赛问题上平均提升25.5%,特别是在最具挑战性的AIME 2025竞赛上准确率翻倍。TANGO还将训练效率提高3.3倍,验证器在无需步骤级标注的情况下也达到了业界领先水平,为大语言模型的推理能力增强开辟了新思路。
    至顶网  科技行者  2025-05-27 15:32:45  
  • 字节跳动MAGREF:革命性技术让你的照片变身栩栩如生的视频,还能保持多个人物与物体的精准特征

    MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
    至顶网  科技行者  2025-06-03 15:18:01  
  • SVRPBench:MBZUAI研究团队打造的首个真实场景随机车辆路径规划基准测试平台

    MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。
    至顶网  科技行者  2025-06-02 16:32:22  
  • 云安全多维关系剖析之产业篇——云计算安全产业观察与思考

    又值岁末年初之际,一直打算撰写一系列文章来梳理云安全产业发展、技术发展的脉络,以期能通过洞察过去,来重塑现在以及展望未来,本文从产业和技术生态环境的角度来探讨云计算及安全产业的现状成因及发展趋势。
    至顶网  业界供稿  2018-01-15 15:19:53  
  • "文本拼接术":马里兰大学和麻省大学研究团队揭示如何将随机文本片段缝合成连贯长篇故事

    这项研究探索了一种全新的AI文本生成方式:"弗兰肯文本"。灵感来自《弗兰肯斯坦》小说,研究者让大型语言模型在一个极端条件下创作:90%的内容必须直接复制自人类写作片段。尽管限制严格,但像Gemini-2.5-Pro这样的模型能生成既符合写作提示又保持连贯的故事。令人惊讶的是,这些混合文本常常逃过AI检测工具的识别——多达59%被误判为人类写作。这项研究不仅挑战了现有AI检测技术,还为混合作者归属研究提供了宝贵数据,并为人类-AI协作写作研究创造了可控的实验环境。
    至顶网  科技行者  2025-06-06 11:24:09  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号