Google 近期加快了 AI 模型的发布节奏,推出了业界领先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而,公司尚未发布这些新模型的安全报告,引发了对透明度的担忧。Google 表示正在权衡快速迭代和获取反馈的方式,承诺未来会发布更多文档,但专家认为这种做法可能会树立不良先例。
Salesforce AI研究院开发的SFR-DeepResearch系统通过创新的强化学习方法,成功训练出能够独立进行复杂深度研究的AI代理。该系统采用单一代理架构,配备基础工具集,通过长度标准化奖励机制避免无效工具调用,在多个基准测试中表现优异,最佳版本在Humanity‘s Last Exam中达到28.7%准确率,为AI向自主问题解决者转变提供了重要突破。