用了 0.022546秒,为您找到彩神 APP 官方 最高 代理 内部 邀请 码罔芷 YB266CN 驻测相关内容1702 条
  • 从令牌到行动:状态机推理减轻信息检索中的过度思考

    这项来自首尔国立大学的研究提出了状态机推理(SMR)框架,解决了大型语言模型在信息检索中的过度思考问题。研究者将推理过程从冗长的令牌生成转变为离散动作(精炼、重排序、停止),使系统能够高效地在状态间转换。实验结果表明,SMR在BEIR和BRIGHT基准测试中显著提高了检索性能,同时减少了74.4%的计算资源消耗,证明其在不同语言模型和检索器中的通用性。这种结构化方法不仅解决了冗余轨迹和误导性推理问题,还为构建更高效的信息检索系统提供了新思路。
    至顶网  科技行者  2025-06-05 12:03:09  
  • 供应链数字孪生:简化物流的18种方式

    数字孪生已经成为企业改善供应链体系、优化供给规划的宝贵工具。凭借着在产品及建筑等领域的出色模拟效果,数字孪生已经初步证明了自身在供应链领域模拟原材料、成品及客户间扩散连接的强大能力。
    至顶网  至顶网CIO与CTO频道  2022-04-28 11:52:49  
  • OpenAI机器手自学解魔方,下一步要实现「自主机器人」

    大多数专家认为,机器人技术的通用化还有很长的道路要走。但OpenAI相信,他们的工作将成为发展的奠基石,并最终成就真正具有自主能力、几乎可以完成所有任务的通用型智能机器。
    至顶网  科技行者  2019-10-24 23:35:42  
  • 企业需要关注的零信任 24 问

    那么零信任到底是什么?它有什么优势?企业该如何部署零信任?腾讯安全围绕零信任基于自身应用实践,梳理了24个常见的问题,帮助用户快速理解。
    至顶网  业界供稿  2021-03-25 14:45:23  
  • 揭秘Trillion 7B:突破性的韩语为中心多语言大模型技术解析

    想象一下,这就像是在一场马拉松比赛中,有些选手获得了高级跑鞋和专业训练营,而其他选手却只能穿着普通鞋子,自行训练。结果可想而知——差距只会越拉越大。Trillion Labs的研究人员正是看到了这一问题,决定寻找一种新的解决方案。
    至顶网  科技行者  2025-04-25 14:22:18  
  • 重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角

    本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学推理基准测试中,CDAS达到了46.77%的最高平均准确率,同时比竞争策略提高了2.33倍的计算效率。研究还证明了CDAS在代码生成任务和更大型模型上的有效性,为提升大型语言模型的推理能力提供了高效可靠的新方法。
    至顶网  科技行者  2025-05-29 14:50:15  
  • 让机器人像人类一样解读图像寓意:上海人工智能实验室开发出人类思维启发的图像理解框架

    这项研究提出了名为"Let Androids Dream"的创新框架,解决了多模态大语言模型在理解图像隐喻方面的核心难题——上下文缺失。通过模拟人类认知过程的三阶段系统(感知、搜索、推理),该框架即使使用轻量级GPT-4o-mini模型,也能在英语和中文图像寓意理解任务中达到最先进性能,在开放式问题上甚至超越GPT-4o模型36.7%。这一成果不仅推动了视觉-语言推理技术的发展,还为未来AI系统理解人类文化中的隐喻和象征提供了新方向。
    至顶网  科技行者  2025-05-28 18:28:12  
  • 美国国家技术信息服务局(NTIS)的AI应用探索

    为了释放数据分析和人工智能的力量,必须配合多管齐下的数据战略消除数据孤岛、迁出遗留系统并淘汰遗留系统,支持数据标准与跨机构信息共享。新兴与创新技术带来了前所未有的机会,帮助我们应对关键任务挑战,以高效、有效、快速且低成本方式提供服务。
    至顶网  至顶网软件与服务频道  2022-12-06 14:48:59  
  • DeepTheorem:腾讯突破性研究如何通过自然语言和强化学习提升大模型定理证明能力

    腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
    至顶网  科技行者  2025-06-03 15:18:36  
  • 约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

    约翰霍普金斯大学研究团队发现,即使给AI模型提供近乎完美的外部反馈,它们仍然无法完全吸收并达到理论最佳表现,这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型,发现所有模型都存在这一局限性,且主要原因是模型的反馈抗拒而非反馈质量问题,为AI自我改进研究指明了新方向。
    至顶网  科技行者  2025-06-19 16:59:50  
  • 产业安全专家谈 | 从攻防两端视角看DDoS的应对策略

    2020年可以说是DDoS这一“经典”攻击技术的复兴之年。受全球新冠疫情的重大影响,DDoS攻击的量级也在不断加大,业内遭受DDoS攻击的频率创下了新高。
    至顶网  业界供稿  2021-03-26 14:13:38  
  • 研究机构能否教会AI自主扩展科学研究?波士顿大学团队揭示代码智能体的"研究盲区"

    这项研究首次系统评估了AI代码智能体在科学研究扩展方面的能力。研究团队设计了包含12个真实研究任务的REXBENCH基准,测试了九个先进AI智能体的表现。结果显示,即使最优秀的智能体成功率也仅为25%,远低于实用化要求,揭示了当前AI在处理复杂科学推理任务时的显著局限性。
    至顶网  科技行者  2025-07-03 10:02:07  
  • 谷歌在中国搞了场“寓教于乐”的大会:堆了无数demo,只为给“AI开发者”来点灵感

    谷歌一直在强调用Gemini将AI践行到底,只不过这次在中国的内容,传递了很多特色故事,这些故事有谷歌的AI如何点亮中国传统文化,如何创造种类繁多的AI应用,以及更重要的,如何赋能中国开发者的成功出海。
    至顶网  周雅  2024-08-09 19:05:21  
  • 对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!

    为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
    至顶网  周雅  2024-01-16 13:31:26  
  • 对话澜码科技创始人周健:大模型的下一个开垦地,AI Agent!

    为什么选择做AI Agent?澜码科技创始人兼CEO周健的解释是:传统的系统是人适应机器,造成人成为数据的搬运工;今天有了大模型,我们有机会让机器去适应人,在这方面AI Agent前景广阔。
    至顶网  周雅  2024-01-16 11:50:17  
  • AI也会"看图说话"了!上海交大团队让机器视觉推理能力提升12%

    这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效,转而采用GRPO强化学习训练法,构建了包含10万样本的VSI-100k数据集。最终,仅20亿参数的vsGRPO-2B模型性能提升12.1%并超越GPT-4o,证明了正确训练方法能够显著释放AI模型的空间理解潜力。
    至顶网  科技行者  2025-07-16 09:16:46  
  • LLM循环助力:创建PARADEHATE数据集实现仇恨言论无毒化

    这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
    至顶网  科技行者  2025-06-05 18:02:59  
  • 记忆坚实的世界:斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

    斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发,他们设计了三种互补的记忆系统:短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性,解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明,该方法在视角回忆一致性和整体视频质量方面显著优于现有技术,为创建持续一致的虚拟世界铺平了道路。
    至顶网  科技行者  2025-06-09 16:59:05  
  • 研究推理的奖励模型:微软提出新方法让AI评判能力更上一层楼

    微软研究院新提出的"奖励推理模型"(RRM)为大型语言模型开创了全新评估方式。传统奖励模型对所有问题使用统一计算资源,而RRM能像人类一样先进行推理思考再做判断,对复杂问题投入更多思考资源。研究团队通过强化学习框架训练模型自主发展推理能力,无需显式示例。实验证明RRM在多个基准测试上表现优异,能自适应扩展计算资源提升判断准确性。该研究为AI评估系统带来范式转变,使人工智能判断更接近人类思考过程。
    至顶网  科技行者  2025-05-26 08:09:01  
  • 贝壳研究院32B模型突破:用开源数据打造推理能力媲美超大模型的"小巧强兵"

    贝壳找房开发的AM-Thinking-v1是一个32B参数的推理优化语言模型,完全基于开源数据训练。该模型在数学推理和代码生成任务上表现出色,AIME2024得分85.3,超越了671B的DeepSeek-R1,证明了通过精心设计的训练流程,中等规模密集模型也能达到超大模型的推理能力。
    至顶网  科技行者  2025-07-09 11:56:44  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号