微软推出了新一代高效 AI 模型 Phi-4,可同时处理文本、图像和语音,且计算资源需求大幅降低。其中 Phi-4-Multimodal 仅有 56 亿参数,Phi-4-Mini 仅有 38 亿参数,性能却超越同等规模竞品,甚至在某些任务上媲美两倍大小的模型。这一突破性进展为开发者提供了先进的 AI 能力,有望推动边缘计算和普及 AI 应用。
Salesforce AI Research团队开发的MCPEval框架为AI助手工具使用能力评估提供了全新解决方案。该框架基于Model Context Protocol标准,实现了从任务生成到深度分析的全自动评估流程,测试了十个AI模型在五个真实领域的表现,揭示了当前AI助手在执行过程与完成质量间存在普遍差距,为AI助手选择和优化提供科学依据。