STRIDE-1
收藏github2025-05-16 更新2025-05-17 收录
下载链接:
https://github.com/tera-ai/tardis
下载链接
链接失效反馈官方服务:
资源简介:
TARDIS STRIDE是一个时空道路图像数据集,用于探索和自主性研究。数据集包含Google StreetView数据,经过彻底清理和模糊处理以保护公民隐私,且不包含任何不良意图、裸露和敏感信息。
TARDIS STRIDE is a spatio-temporal road image dataset intended for exploration and autonomy-related research. The dataset includes Google StreetView data, which has been thoroughly cleaned and anonymized to protect citizens' privacy, and contains no malicious content, nudity, or sensitive information.
创建时间:
2025-05-16
原始信息汇总
TARDIS STRIDE: 时空道路图像数据集概述
数据集基本信息
- 名称: TARDIS STRIDE (Spatio-Temporal Road Image Dataset for Exploration and Autonomy)
- 类型: 时空道路图像数据集
- 用途: 探索与自主系统开发
- 数据来源: Google StreetView(经过隐私处理)
数据集内容
- 训练数据:
training.jsonl(约327GB) - 测试数据:
testing.jsonl(约9GB) - 检查点文件:
checkpoint.msgpack(约10GB)
数据获取方式
- 下载命令: bash gsutil -m cp gs://tera-tardis/STRIDE-1/training.jsonl . gsutil -m cp gs://tera-tardis/STRIDE-1/testing.jsonl . gsutil -m cp gs://tera-tardis/STRIDE-1/checkpoint.msgpack .
隐私与安全
- 数据经过彻底清洗和模糊处理
- 符合Google StreetView隐私政策(https://www.google.com/streetview/policy/)
相关资源
- 论文: 待发布
- 数据集地址: https://huggingface.co/datasets/Tera-AI/STRIDE
引用格式
bibtex @article{2025_tardis_stride, title={TARDIS STRIDE: Spatio-temporal World Modeling for Real-world Autonomous Systems}, author={Héctor Carrión, Yutong Bai, Víctor A. Hernández Castro, Kishan Panaganti, Ayush Zenith, Matthew Trang, Tony Zhang, Pietro Perona, Jitendra Malik}, journal={TBD preprint}, year={2025}, }
联系方式
- Héctor Carrión: hector@tera.earth
- Yutong Bai: ytongbai@gmail.com
- Víctor A. Hernández Castro: vhernandezcastro@gmail.com
- Kishan Panaganti: kpb@caltech.edu
- Ayush Zenith: ayush@tera-ai.com
- Matthew Trang: matthew@tera.earth
- Tony Zhang: tony@tera-ai.com
搜集汇总
数据集介绍

构建方式
STRIDE-1数据集作为时空道路图像数据集,其构建过程体现了严谨的学术规范与技术深度。研究团队基于谷歌街景数据,通过分布式采集系统获取覆盖多区域、多时段的道路场景影像,并采用自动化清洗流水线剔除低质量样本。所有数据均经过隐私保护处理,包括人脸模糊化和敏感信息过滤,严格遵循谷歌街景数据使用政策。数据集采用JSONL格式存储,包含训练集(327GB)和测试集(9GB)两个模块,确保数据结构的标准化与可扩展性。
特点
该数据集的核心价值在于其独特的时空特性与工程实用性。作为面向自动驾驶领域的研究资源,它提供了连续帧的道路场景图像,蕴含丰富的环境动态变化信息。数据覆盖不同光照条件、天气状况和交通场景,具有显著的地理多样性特征。技术层面采用高效的消息包格式存储模型检查点(10GB),支持分布式训练与评估。特别值得注意的是,所有数据均通过伦理审查,消除了隐私泄露风险,为合规性研究提供了保障。
使用方法
使用该数据集需配置CUDA计算环境,支持Conda虚拟环境与Docker容器两种部署方式。通过Google Cloud Storage命令行工具可高效下载数据文件,训练流程提供单机与Kubernetes分布式两种方案。评估阶段需转换EasyLM格式至HuggingFace兼容格式,配套Jupyter Notebook实现可视化分析。数据集设计充分考虑了工程易用性,从环境配置到模型训练形成完整闭环,研究者可快速复现基准实验或开展衍生研究。
背景与挑战
背景概述
STRIDE-1数据集由Tera-AI团队于2025年推出,是一个专注于时空道路图像分析的高质量数据集,旨在推动自动驾驶和现实世界自主系统的研究。该数据集由Héctor Carrión、Yutong Bai、Víctor A. Hernández Castro等多名研究者共同开发,并得到了计算机视觉领域知名学者Pietro Perona和Jitendra Malik的支持。其核心研究问题聚焦于如何利用街景图像的时空信息构建高效的世界模型,为自动驾驶系统提供更精准的环境感知能力。数据集基于Google StreetView数据构建,经过严格的隐私处理,确保了数据的合规性和安全性。STRIDE-1的发布为时空建模、道路场景理解和自主决策等研究方向提供了重要的基准资源。
当前挑战
STRIDE-1数据集面临的挑战主要体现在两个方面:在领域问题层面,如何从复杂的街景图像中提取有效的时空特征仍然是一个开放性问题,尤其是在光照变化、天气条件和视角多样性等干扰因素下保持模型的鲁棒性;在数据构建层面,处理大规模街景数据涉及巨大的存储和计算开销,同时确保隐私保护措施(如人脸和车牌模糊化)的全面性也对数据处理流程提出了严格要求。此外,数据集的时空连续性要求对图像采集和标注过程提出了更高标准,如何平衡数据规模与标注质量成为关键挑战。
常用场景
经典使用场景
STRIDE-1数据集作为时空道路图像数据集,广泛应用于自动驾驶领域的研究与开发。其经典使用场景包括自动驾驶车辆的感知系统训练,通过高精度的街景图像数据,帮助车辆理解复杂的道路环境和动态变化。数据集提供的时空信息使得研究者能够模拟真实世界中的驾驶场景,从而优化自动驾驶算法的性能。
衍生相关工作
STRIDE-1数据集衍生了许多经典研究工作,包括基于深度学习的多模态感知算法、时空环境建模方法以及自动驾驶决策系统的优化。这些工作不仅扩展了数据集的应用范围,还为自动驾驶领域的其他研究提供了宝贵的参考和灵感,推动了整个领域的快速发展。
数据集最近研究
最新研究方向
STRIDE-1数据集作为时空道路图像数据集,在自动驾驶和智能交通系统领域引起了广泛关注。该数据集通过整合高分辨率的Google StreetView数据,并结合先进的时空建模技术,为研究人员提供了丰富的道路场景信息。近年来,STRIDE-1被广泛应用于自动驾驶算法的训练和测试,特别是在多模态感知和路径规划方面的研究取得了显著进展。随着自动驾驶技术的快速发展,STRIDE-1数据集在提升算法鲁棒性和泛化能力方面发挥了重要作用。其独特的时空特性也为研究动态环境下的自动驾驶行为提供了宝贵的数据支持。该数据集的发布不仅推动了自动驾驶领域的技术创新,还为相关政策的制定和评估提供了科学依据。
以上内容由遇见数据集搜集并总结生成



