five

commaai/commavq

收藏
Hugging Face2025-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/commaai/commavq
下载链接
链接失效反馈
官方服务:
资源简介:
commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,适用于机器学习研究,特别是GPT类视频预测模型的实验。数据集使用VQ-VAE技术将每帧视频压缩为128个10位token,每个数据条目为1分钟的压缩驾驶视频片段,文件格式为int16。压缩是有意为之的,以减少数据集大小并便于使用。

commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,适用于机器学习研究,特别是GPT类视频预测模型的实验。数据集使用VQ-VAE技术将每帧视频压缩为128个10位token,每个数据条目为1分钟的压缩驾驶视频片段,文件格式为int16。压缩是有意为之的,以减少数据集大小并便于使用。
提供机构:
commaai
原始信息汇总

数据集概述

数据集名称

commaVQ

数据集内容

commaVQ是一个包含100,000个高度压缩驾驶视频的数据集,专为机器学习研究设计。这些高度压缩的驾驶视频对于实验GPT类视频预测模型非常有用。

数据集特点

  • 压缩技术:使用VQ-VAE技术将每帧压缩为128个10位的“tokens”。
  • 数据格式:每个数据集条目是一个压缩的驾驶视频片段,即每分钟20帧的视频。每个文件的形状为1200x8x16,并以int16格式保存。
  • 压缩程度:压缩过程故意造成大量信息损失,以减小数据集大小并便于处理(如训练具有大上下文大小的GPT,快速自回归生成等)。

数据集规模

  • 数据量:100,000个视频
  • 大小范围:100K<n<1M

许可证

MIT

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作