华为昇腾团队发布了Pangu Pro MoE,这是全球首个采用混合分组专家(MoGE)架构的72B参数稀疏语言模型。该模型专为昇腾NPU优化设计,通过创新的专家分组策略解决了传统MoE模型的负载不均衡问题,实现了完美的计算负载分配。模型仅激活16B参数处理每个token,在推理效率上显著超越同规模密集模型,为大规模AI应用提供了高效解决方案。
Databricks 推出多项新产品和功能升级,旨在帮助企业更轻松地部署和扩展 AI 代理。新功能包括扩展 Mosaic AI Gateway 支持更多模型、推出 AI/BI Genie 对话 API 套件、升级 Agent 评估审查应用等。这些举措旨在解决企业在关键场景中部署 AI 代理时的顾虑,提高 AI 代理的可控性和可追踪性。