Capital One推出了生产级多智能体AI系统来增强购车体验。该系统包含四个协作的AI智能体:一个与客户沟通,一个基于业务规则创建行动计划,一个评估前两者的准确性,一个向用户解释和验证计划。系统设计时考虑了金融机构的严格要求,采用动态迭代方法,并融入了风险管理框架。技术上使用开源权重模型和NVIDIA推理堆栈。首个应用Chat Concierge已在汽车业务中部署,客户参与度提升达55%。
Google DeepMind通过Physics-IQ基准测试发现,尽管当前AI视频模型能生成视觉上极为逼真的内容,但其物理理解能力严重不足。研究使用396个真实物理实验视频测试了8个主流模型,结果显示最佳模型得分仅为29.5%。更重要的是,视觉真实度与物理理解能力之间几乎无关联,这一发现对AI发展具有重要启示意义。