这篇研究论文介绍了"GeoRanker",这是一种突破性的全球图像地理定位方法,由香港城市大学和威斯康星大学麦迪逊分校研究人员联合开发。不同于传统方法,GeoRanker采用了距离感知排序框架,利用大型视觉语言模型对查询图像与候选位置之间的关系进行建模。核心创新在于提出的多阶距离损失,不仅考虑绝对距离还建模相对空间关系,以及构建的首个地理排序数据集GeoRanking。实验表明,GeoRanker在IM2GPS3K和YFCC4K基准测试上显著超越现有方法,在街道级准确率上分别提升12.9%和37.3%。
至顶网 科技行者 2025-05-27 10:26:01