highD, rounD, and inD datasets|交通研究数据集|车辆轨迹分析数据集
收藏数据集概述
数据集名称
Dronalize
数据集用途
- 数据预处理
- 数据可视化
- 模型评估
- 数据驱动运动预测模型的开发
数据集依赖工具
- PyTorch
- PyTorch Geometric
- PyTorch Lightning
支持的数据集
- highD
- rounD
- inD
数据集来源
这些数据集来自leveLXData,包含德国不同地点(高速公路、环岛、交叉口)记录的轨迹数据。
数据集特点
- 高质量和可靠性
- 适用于早期研究和发展
- 免费提供非商业用途
数据集更新
- 最近更新(2024年4月)包括地图改进和新地点的添加。
- 推荐使用最新版本以避免修改工具箱。
数据集使用
- 数据集需要通过指定链接申请使用。
- 数据集预处理包括解压缩和放置在指定目录。
- 预处理脚本支持多线程以提高处理效率。
数据集模型
- 提供了一个基于编码器-解码器的基线神经网络模型,用于轨迹预测。
- 模型通过将场景编码为图并通过GNN处理数据来学习道路用户之间的交互。
数据集评估
- 包括多种评估指标,如最小平均位移误差(minADE)、最小最终位移误差(minFDE)等。
- 支持单模态和多模态预测评估。
数据集安装
- 推荐使用容器(Apptainer或Docker)进行安装,以确保可重复性和跨环境一致性。
- 也支持通过conda环境进行安装。
数据集训练
- 提供训练脚本,支持GPU加速和实验跟踪(如使用wandb)。
- 训练脚本使用PyTorch Lightning,并支持自定义配置和参数。
数据集贡献
- 欢迎贡献,具体指南请参考相关文档。
数据集引用
- 使用数据集时,请参考相关论文进行引用。
数据集相关工作
- 数据集与相关研究工作紧密相关,具体内容请参考相关文献。

CIFAR-10
CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。
OpenDataLab 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
NREL Wind Integration National Dataset (WIND) Toolkit
NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。
www.nrel.gov 收录
Online Retail II
该在线零售II数据集包含了一家英国注册的非实体店铺在线零售商在2009年12月1日至2011年12月9日期间发生的所有交易记录。该公司主要销售各种场合的独特礼品。该公司的许多客户是批发商。
github 收录