南洋理工大学与SenseTime Research的研究团队提出了ProxyV,一种创新算法,解决大型多模态模型处理视觉信息时的计算冗余问题。与传统方法不同,ProxyV不减少视觉标记数量,而是引入少量"代理视觉标记"替代原始标记参与繁重计算,通过轻量级模块引导原始标记更新。实验表明,ProxyV可在保持甚至提升性能的同时,将计算量和时间减少30%-46%。该方法还提供了非空间变体,可与其他优化方法结合使用,展现了平衡效率与精度的新思路。
至顶网 科技行者 2025-05-27 13:25:00