UniGeo是一项开创性研究,它利用视频扩散模型来一致性地估计视频中的几何信息(如表面法线和坐标)。与传统方法不同,UniGeo在全局参考坐标系中进行预测,而非每帧的局部相机坐标系,从而有效利用视频模型中的帧间对应关系。研究团队提出了共享位置编码策略,并采用多任务联合训练方法,显著提高了几何属性预测的准确性和一致性。实验表明,即使只在静态视频数据上训练,UniGeo也能泛化到动态场景,为VR/AR、机器人技术和自动驾驶等领域提供了可靠的几何信息估计解决方案。
至顶网 科技行者 2025-06-04 13:33:15