加州大学研究团队开发的DOVE系统彻底革新了AI图像处理方式,不再用固定长度表示所有图像,而是根据图像复杂度智能调整表示长度。就像人类描述简单白墙只需几句话,而描述繁忙街景需要更多细节一样,DOVE为简单图像分配更少的"视觉词汇",为复杂图像提供更多描述单元。实验证明,这种动态方法不仅节省计算资源,还提升了语义理解能力,在各类视觉任务中表现卓越。其查询条件化变体Q-DOVE更进一步,能根据用户问题聚焦相关图像区域,进一步提高效率与理解能力。
至顶网 科技行者 2025-06-10 09:24:31