commaai/commavq
收藏Hugging Face2025-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/commaai/commavq
下载链接
链接失效反馈官方服务:
资源简介:
commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,适用于机器学习研究,特别是GPT类视频预测模型的实验。数据集使用VQ-VAE技术将每帧视频压缩为128个10位token,每个数据条目为1分钟的压缩驾驶视频片段,文件格式为int16。压缩是有意为之的,以减少数据集大小并便于使用。
commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,适用于机器学习研究,特别是GPT类视频预测模型的实验。数据集使用VQ-VAE技术将每帧视频压缩为128个10位token,每个数据条目为1分钟的压缩驾驶视频片段,文件格式为int16。压缩是有意为之的,以减少数据集大小并便于使用。
提供机构:
commaai
原始信息汇总
数据集概述
数据集名称
commaVQ
数据集内容
commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,专为机器学习研究设计。这些高度压缩的驾驶视频对于实验GPT类视频预测模型非常有用。
数据集特点
- 压缩技术:使用VQ-VAE技术将每帧压缩为128个10位的“tokens”。
- 数据格式:每个数据集条目是一个压缩的驾驶视频片段,即每分钟20帧的视频。每个文件的形状为1200x8x16,并以int16格式保存。
- 压缩程度:压缩过程故意造成大量信息损失,以减小数据集大小并便于处理(如训练具有大上下文大小的GPT,快速自回归生成等)。
数据集规模
- 数据量:100,000个视频
- 大小范围:100K<n<1M
许可证
MIT



