STRIDE-QA
收藏arXiv2025-08-14 更新2025-11-28 收录
下载链接:
https://turingmotors.github.io/stride-qa/
下载链接
链接失效反馈官方服务:
资源简介:
STRIDE-QA是一个大规模视觉问答(VQA)数据集,用于物理场景下的自主驾驶中的时空推理。该数据集包含来自东京100小时的多传感器驾驶数据,捕捉了交通拥堵、施工区域和行人密集的交叉路口等多样性和挑战性条件。STRIDE-QA是城市驾驶中时空推理的最大VQA数据集,提供超过285K帧的16M QA对。该数据集通过密集的自动生成注释,包括3D边界框、分割掩码和多对象跟踪,通过三个新颖的QA任务支持对象中心、自我中心和时空推理。这些任务要求空间定位和短期预测,为下游规划和决策中的安全关键城市环境提供了系统性的测量。通过将每个QA对建立在物理和时序一致的注释中,STRIDE-QA为在现实世界自动驾驶中进行训练和基准测试的VLMs提供了全面的基础。
提供机构:
图灵公司
创建时间:
2025-08-14



