data-dive-campus-cams
收藏Hugging Face2026-04-24 更新2026-04-25 收录
下载链接:
https://huggingface.co/datasets/dr-pod/data-dive-campus-cams
下载链接
链接失效反馈官方服务:
资源简介:
UIUC校园摄像头数据集(2026年春季)包含来自三个UIUC YouTube直播流的帧级存档,分别以10秒(Quad)、30秒(Alma)和3秒(Morrow)的间隔捕获。每帧配有元数据(时间戳、亮度、捕获状态)。该数据集是为研究UIUC课程释放时行人激增如何导致校园交叉路口公交车延误而收集的,与MTD GTFS-Realtime交通数据存档配对使用。数据集支持多种分析,如行人密度与交通延误的关联、雕像停留时间行为、车辆速度/轨迹估计以及天气/日光信号提取。数据以WebDataset兼容的tar文件格式存储,每摄像头每小时一个文件,包含JPEG图像和JSON元数据。数据集适用于图像分类、目标检测等任务,特别适合交通、行人流、城市感知和时间序列分析的研究。
创建时间:
2026-04-23
原始信息汇总
数据集概述:UIUC Campus Cams — Spring 2026
该数据集是一个从三台伊利诺伊大学香槟分校(UIUC)的公共 YouTube 直播流中捕获的帧级图像存档,用于研究校园行人潮汐与公交延误之间的关系。
核心内容
- 数据集名称:UIUC Campus Cams — Spring 2026
- 数据集地址:https://huggingface.co/datasets/dr-pod/data-dive-campus-cams
- 任务类型:图像分类、目标检测
- 数据集规模:100,000 至 1,000,000 张图像
- 许可协议:研究用途(非商业),许可详情见 GitHub 仓库
- 标签:交通、行人流动、城市感知、时间序列
相机设置与采样
- 相机 ID 与间隔:
quad:主四边形广场(Foellinger 露台视角),采样间隔 1 秒alma:Alma Mater 雕像与访客广场,采样间隔 1 秒morrow:Morrow Plots 与 Wright 街走廊,采样间隔 1 秒
- 采样频率:2026-04-23T10:50Z 之后统一以 1 Hz 采样,之前按各相机
camera_meta.json中记录的时间间隔变化。 - 数据存储格式:每个相机每小时一个 WebDataset 兼容的 tar 包,目录结构为
data/{cam}/{YYYY-MM-DD}/{cam}-{YYYY-MM-DD}-{HH}.tar,每个 tar 包含成对的 JPEG 图像(1280x720,质量因子 5)和 JSON 元数据文件。
元数据字段
每帧附带的 JSON 文件包含:
ts:时间戳(UTC)ok:捕获是否成功bytes:图像文件大小path:图像文件路径camera_id:相机标识intended_interval_s:预期采样间隔(秒)resolution:分辨率brightness_mean:平均像素亮度([0,1] 范围,用于筛选夜间帧)attempts:捕获尝试次数err:错误信息(如有)
支持的分析示例
- 行人密度与公交延误相关性:通过主四边形广场的行人数量与相邻走廊上 MTD 公交车通过时间的对比分析。
- 雕像区域停留行为:检测 Alma 相机画面中的个体访客,分析停留时间分布与时间、天气、学术事件的关系。
- 车辆速度与轨迹估计:利用 Morrow 相机每秒采样,从连续帧的像素位移估算公交车速度。
- 天气与日光信号提取:基于每帧的
brightness_mean字段获取昼夜及云量协变量。 - 行为识别:在 Quad 相机画面中捕捉自行车和滑板者的完整轨迹。
已知限制
- 人脸识别:行人面部尺寸约为 15-25 像素,无法识别,不包含个体追踪标签。
- 夜间帧:对比度低,人物检测召回率差。
- Alma 相机视角:专门指向雕像,未覆盖相邻街道。
- Morrow 走廊:中景存在春季 2026 年 ARC 工地的施工设备。
- 捕获间隙:流媒体故障可能导致帧丢失,
index.jsonl记录每次尝试的成功或失败状态。
搜集汇总
数据集介绍

构建方式
该数据集源自伊利诺伊大学厄巴纳-香槟分校(UIUC)校园内三个公开的YouTube直播视频流,通过以不同时间间隔(Quad摄像头的10秒、Alma摄像头的30秒、Morrow摄像头的3秒)捕获帧图像,后期统一提升至1 Hz采样率构建而成。每个摄像头帧均配有详细的元数据,包括时间戳、亮度均值及捕获状态。数据以WebDataset兼容的tar包形式组织,按摄像头、日期和小时分片,每帧包含1280x720分辨率的JPEG图像和对应的JSON元数据文件。与此同时,数据集还同步收录了MTD GTFS-Realtime公交实时数据,以支撑校园交通拥堵与公交延误的关联分析。
特点
该数据集的核心特点在于其多模态、时间密集的校园场景感知能力。三个摄像头分别聚焦于主广场行人密度、地标雕像访客行为以及道路车辆轨迹,覆盖了校园交通枢纽的典型微观动态。每帧的亮度均值字段提供了免费的昼夜与云量协变量,便于过滤低质量夜间帧。数据集支持从行人检测、轨迹追踪到公交速度估计等多种分析任务,且帧间隔(1秒)足以捕捉自行车和滑板车等快速移动目标的完整轨迹。同时,数据集明确标注了人脸不可识别、夜间召回率低、拍摄视角固定等局限性,确保了使用的诚信与透明。
使用方法
使用该数据集时,用户可通过WebDataset标准接口直接读取tarball中的图像-元数据对。建议利用元数据中的`intended_interval_s`字段对齐不同摄像头的时间序列,并结合`brightness_mean`滤除夜间帧以提高检测精度。典型分析流程包括:在Quad摄像头上通过目标检测模型统计广场行人数量,并与MTD公交数据中对应时段的行车时间进行相关性分析;在Alma摄像头上使用跟踪算法估计访客停留时间分布;在Morrow摄像头上通过连续帧像素位移推算公交车辆速度。所有分析均可在Python环境下通过常见的深度学习框架(如PyTorch)和计算机视觉库(如OpenCV)实现。
背景与挑战
背景概述
UIUC Campus Cams — Spring 2026 数据集由数据挖掘项目 data-dive 团队创建,聚焦于伊利诺伊大学厄巴纳-香槟分校(UIUC)校园交通与行人流动态监测。该数据集通过捕捉校园内三个关键点位(Quad、Alma Mater 雕像、Morrow Plots)的 YouTube 直播视频帧,结合 MTD GTFS-Realtime 公交数据,旨在量化下课高峰期间行人潮对公交延误的影响。核心研究问题在于揭示行人密度与公共交通效率之间的时空关联,为智慧城市感知与交通优化提供实证基础。数据集自2026年春季采集,包含超过10万帧图像及同步元数据,已在城市传感、行人轨迹分析领域引起关注,尤其为校园级微观交通建模提供了高时间分辨率的基准资源。
当前挑战
该数据集面临多重挑战。首先,图像分类与目标检测领域需应对低光照条件下(如夜间帧)行人识别召回率低的问题,同时视频帧中行人面部仅15–25像素大小,虽避免隐私泄露却增加了个体跟踪的难度。其次,构建过程中遭遇摄像头采样间隔动态调整(由原始1秒间隔变为不等间隔)导致的时序对齐复杂性,以及流媒体传输中断引发的帧缺失,需通过元数据中的'ok'字段与错误日志进行补偿。此外,Alma 摄像头聚焦于雕像而非街道,限制了交通流分析的适用性;Morrow 走廊因施工设备干扰背景,影响车辆检测精度。这些技术障碍要求研究者开发鲁棒的帧筛选与多源数据融合方法。
常用场景
经典使用场景
该数据集捕捉了伊利诺伊大学香槟分校三个公共地点的实时影像帧,以10秒、30秒和3秒不等的间隔记录主广场、Alma Mater雕像及Morrow走廊的动态变化。其经典使用场景聚焦于行人流量分析与公交延误预测,通过量化课堂释放期间主广场行人密度与相邻走廊公交通行时间的关联,揭示校园交通拥堵的深层诱因。此外,数据集每帧附带的亮度均值元数据支持昼夜与天气信号的提取,为时间序列分析提供了稳健的协变量基础。
解决学术问题
数据集致力于解决城市传感与交通工程领域的交叉难题,即如何利用非侵入式视觉数据建模行人与车辆交互对公共交通效能的影响。通过高精度帧级元数据与GTFS-Realtime公交数据的配对,研究人员可量化高峰时段行人涌浪对公交准点率的动态滞后效应,填补了微观行人行为与宏观交通流模型之间的实证空白。此外,Alma摄像头的游客驻留时间分析有助于理解公共空间使用模式的时间异质性,为城市设计提供量化依据。
衍生相关工作
该数据集催生了多项开创性研究工作,包括基于密集帧级的行人轨迹重构与公交速度估计方法,通过Morrow摄像头的1秒间隔影像验证了像素级位移与真实车速的映射关系,推动了低帧率视频下的运动分析技术。此外,主广场行人密度时间序列与GTFS-Realtime延误数据的融合模型,成为了城市场景下因果推断的基准案例。Alma摄像头游客驻留时间的分布建模为公共空间行为动力学提供了新范式,并启发了结合环境光照与事件日历的时变分析框架。
以上内容由遇见数据集搜集并总结生成



