SpatialVID-HQ
收藏SpatialVID-HQ 数据集概述
数据集基本信息
- 名称:SpatialVID-HQ
- 许可证:CC-BY-NC-SA-4.0(署名-非商业性使用-相同方式共享 4.0 国际)
- 语言:英语
- 数据规模:大于1TB
数据集结构
目录组织
DATA_PATH/ ├─ annotations/ │ ├─ group_0001/ │ │ ├─ 0a00f99d/ │ │ │ ├─ caption.json │ │ │ ├─ dyn_masks.npz │ │ │ ├─ intrinsics.npy │ │ │ └─ poses.npy │ │ ├─ 0a7b25d8/ │ │ │ ├─ caption.json │ │ │ ├─ dyn_masks.npz │ │ │ ├─ intrinsics.npy │ │ │ └─ poses.npy │ │ └─ ... │ ├─ group_0002/ │ └─ ... ├─ videos/ │ ├─ group_0001/ │ │ ├─ 0a00f99d.mp4 │ │ ├─ 0a7b25d8.mp4 │ │ └─ ... │ ├─ group_0002/ │ └─ ... ├─ metadata.csv └─ README.md
文件类型
- 视频文件:MP4格式
- 标注文件:
- caption.json:视频描述
- dyn_masks.npz:动态掩码
- intrinsics.npy:相机内参
- poses.npy:相机位姿
- 元数据文件:metadata.csv
元数据信息
metadata.csv文件包含以下字段:
- id:视频片段的唯一标识符
- group id:视频所属组的标识符
- video path:视频文件的相对路径
- annotation path:标注文件的相对路径
- num frames:视频帧数
- fps:视频帧率
- resolution:视频分辨率
- aesthetic score:美学评分
- luminance score:亮度评分
- motion score:运动评分
- ocr score:OCR评分
- moveDist:相机移动距离
- distLevel:相机移动距离等级(1-5级)
- rotAngle:相机旋转角度
- trajTurns:轨迹转弯次数
- dynamicRatio:动态内容比例
- motionTags:运动描述标签
- sceneType:场景类型(室内、室外等)
- brightness:亮度水平(暗、正常、亮)
- timeOfDay:拍摄时间(早晨、下午、傍晚、夜晚)
- weather:天气条件(晴天、多云、雨天)
- crowdDensity:人群密度(稀疏、中等、密集)
下载方式
使用以下命令下载完整数据集:
hf download SpatialVID/SpatialVID-HQ --repo-type dataset
使用说明
解压group_0*.tar.gz文件:
tar -xzvf annotations/group_0001.tar.gz tar -xzvf annotations/group_0002.tar.gz ...
使用pandas加载元数据: python import pandas as pd metadata = pd.read_csv(metadata.csv)
许可证信息
采用CC-BY-NC-SA-4.0许可证,要求:
- 必须署名原作者
- 仅限非商业用途
- 衍生作品必须采用相同许可证




