华为昇腾团队发布了Pangu Pro MoE,这是全球首个采用混合分组专家(MoGE)架构的72B参数稀疏语言模型。该模型专为昇腾NPU优化设计,通过创新的专家分组策略解决了传统MoE模型的负载不均衡问题,实现了完美的计算负载分配。模型仅激活16B参数处理每个token,在推理效率上显著超越同规模密集模型,为大规模AI应用提供了高效解决方案。
HASHIRU是一个创新的多智能体系统,由加州大学戴维斯研究团队开发,采用"CEO-员工"层级结构,动态管理AI智能体团队。系统优先使用小型本地语言模型,仅在必要时调用更强大的外部API,通过经济模型控制资源分配,并能自主创建新工具扩展功能。实验表明,它在复杂推理任务上显著优于单一模型(如GSM8K:96% vs 61%),并能有效执行学术论文评审和安全评估任务,展现了更灵活、更高效的AI协作新范式。