这篇研究介绍了一种名为YAQA(Yet Another Quantization Algorithm)的训练后量化技术,由康奈尔大学研究团队开发。与传统方法不同,YAQA不仅关注局部激活误差,而是考虑整个模型的KL散度,通过Kronecker分解的Hessian矩阵估计来实现更精准的参数量化。实验表明,YAQA能将模型与原始版本的KL散度降低约30%,同时在下游任务上实现最先进性能,为大型语言模型的高效部署提供了新方案。
Google 为 Gemini 聊天机器人推出重大升级,允许其访问用户的 Google 搜索历史,以提供更个性化的结果。这项功能可让 Gemini 深入了解用户兴趣,并根据需求和偏好提供定制化回应。尽管引发了隐私担忧,但 Google 表示用户可随时控制数据访问权限。该功能目前已在多个国家推出,未来还将扩展到其他 Google 服务。