Google DeepMind团队发布了EmbeddingGemma,这是一个仅有3.08亿参数的轻量级文本理解模型,却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一,支持250多种语言,特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术,实现了性能与效率的完美平衡,为AI技术普及化开辟了新路径。
Good Start Labs与多位独立研究者合作开发了首个让任意大语言模型无需训练即可玩完整外交游戏的评估框架。通过优化文本化游戏状态表示,240亿参数模型就能可靠完成比赛。研究发现模型会自然展现承诺、背叛、联盟等复杂策略行为,且不同模型表现出独特的"外交性格"。该框架大幅降低了AI战略推理研究门槛,为理解语言模型的策略能力提供了新途径。