这项研究提出了"下一事件预测"作为培养视频AI时间推理能力的新方法。研究者将视频分为过去和未来部分,让AI预测未来事件,而不仅仅是描述所见。他们创建了V1-33K数据集(包含33,000个视频片段)和FutureBench测试基准,实验证明这种方法显著提升了模型的时间推理能力。研究发现,演绎推理(通过下一事件预测)比归纳推理(视频问答)和溯因推理(先前事件预测)更有效,简单的监督式微调就能取得良好效果,且增加数据量超过5K后效果提升不明显。
至顶网 科技行者 2025-06-03 07:42:38