这项研究由浙江大学和阿里巴巴通义实验室合作完成,提出了一种名为"时序感知分层认知强化学习"(TimeHC-RL)的创新方法,旨在提升大语言模型的社交智能。研究者观察到,虽然大模型在数学等领域进步显著,但社交领域需要不同的认知模式,从直觉反应到深度推理。TimeHC-RL通过两大创新——时序感知奖励机制和分层认知框架,使7B参数的基础模型在多个社交智能测试中实现了29个百分点的提升,达到与DeepSeek-R1和OpenAI-O3等高级模型相当的性能水平,为构建更具人性化的AI开辟了新路径。
至顶网 科技行者 2025-07-07 17:34:35