Waymo Open Dataset v2.0.0|自动驾驶数据集|LiDAR数据处理数据集
收藏数据集概述
数据集名称
- Waymo Open Dataset v2.0.0
数据集用途
- 用于LiDAR扫描的可视化
- 用于使用Pytorch框架进行语义分割学习
数据集版本
- v2.0.0
数据集内容
- 训练集:
- 798个序列
- 158,081个点云数据
- 23,691个关键点云数据
- 23,691个语义和实例标签
- 验证集:
- 202个序列
- 39,987个点云数据
- 5,976个关键点云数据
- 5,976个语义和实例标签
- 测试集:
- 16个序列
- 3,101个点云数据
数据集预处理
- 使用
python preprocess.py /path/to/your/waymo/dataset
进行预处理,生成包含点云和标签的预处理数据集。
数据集加载
- 使用
Waymo
类从数据集中加载点云和标签数据。 - 参数包括
split
(训练、验证或测试),has_image
(是否加载图像,目前仅支持False
),has_label
(是否加载标签,影响加载的点云数量)。
数据集投影
- 使用
RangeProjection
类将点云投影到范围图像。
Pytorch数据加载器
- 使用
WaymoLoader
类创建Pytorch数据加载器,用于模型训练和推理。

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录