本研究提出了双头优化(DHO)框架,一种解决视觉-语言模型知识蒸馏中梯度冲突问题的创新方法。通过设计两个独立的预测头分别学习标记数据和教师信号,DHO有效缓解了传统单头方法中的梯度冲突,提升了特征学习质量。实验结果显示,DHO在ImageNet等11个数据集上一致超越基线方法,使用1%标记数据时较现有最佳方法提高了3%的准确率,同时参数量更少。此外,DHO支持推理时通过线性组合双头输出灵活调整模型表现,为半监督学习下的知识蒸馏提供了一种简单高效的解决方案。
至顶网 科技行者 2025-05-21 14:23:13