smooth-hierarchy-ucf101-train-reproduce-v1

Hugging Face2026-04-24 更新2026-04-25 收录

下载链接：

https://huggingface.co/datasets/aditijc/smooth-hierarchy-ucf101-train-reproduce-v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集为UCF101视频动作识别基准数据集，通过`quchenyuan/UCF101-ZIP`源获取。数据以视频片段形式存储，典型训练配置为64x64分辨率下128的批量大小。作为计算机视觉领域经典基准，适用于动作分类、时序建模等任务。原始README未提供详细数据统计，但根据标准UCF101规范应包含101类动作的13,320个视频片段。

创建时间：

2026-04-22

原始信息汇总

根据您提供的数据集详情页面内容，以下是该数据集的概述：

数据集概述

数据集名称：smooth-hierarchy-ucf101 — train reproduce bundle

标签：smooth-hierarchy, reproduce, ucf101

最新作业编号：7022887（仓库头版本：348c9cfca3765afb401128a35d361af4b5df3b21）

复现方法

该数据集提供了重现主要运行的步骤，具体如下：

环境准备：SSH 到配备 H200（或 A100/H100）GPU 的高性能计算集群。
仓库拉取：拉取 smooth-hierarchy 仓库，版本为 348c9cfca3765afb401128a35d361af4b5df3b21。
环境构建与数据下载：运行 setup.sbatch 脚本，构建虚拟环境并从 quchenyuan/UCF101-ZIP 下载 UCF101 数据集。
密钥配置：在 ~/.raca/keys.env 文件中填入 WANDB_API_KEY 和 HF_TOKEN。
运行训练：执行 sbatch main.sbatch。该脚本会：
- 自动从 last.ckpt 恢复（如果存在）。
- 在 UCF101 数据集上运行 50 个 epoch，批次大小为 128，分辨率为 64x64。
- 每约 10 分钟上传滚动检查点到 smooth-hierarchy-ucf101-checkpoints-v1。

数据存储与版本

每次提交都会生成一个作业相关的元数据 parquet 文件。
旧作业的数据包保留在 job-<id>/ 目录下，不会自动删除。

搜集汇总

数据集介绍

构建方式

该数据集以UCF101动作识别数据集为基础，通过smooth-hierarchy方法进行构建与复现。整个构建流程依赖于高性能计算集群（HPC），并配备H200、A100或H100等GPU加速。首先，通过SSH连接到HPC，拉取smooth-hierarchy仓库的指定版本（commit head 348c9cfca3765afb401128a35d361af4b5df3b21）。随后运行setup.sbatch脚本，创建虚拟环境并从quchenyuan/UCF101-ZIP下载UCF101原始数据。环境配置完成后，需在~/.raca/keys.env文件中设置WANDB_API_KEY和HF_TOKEN认证密钥。最后执行main.sbatch脚本启动训练，该脚本支持从last.ckpt自动断点续训，在UCF101数据集上运行50个epoch，批大小为128，输入尺寸为64×64像素。训练过程中，模型检查点每约10分钟自动上传至smooth-hierarchy-ucf101-checkpoints-v1仓库。每次提交作业都会生成一个包含作业特定元数据的parquet文件，历史作业的数据包则保留在对应的job-<id>/目录下。

特点

该数据集最显著的特点在于其完整的可复现性设计。每个作业均包含独立的元数据parquet文件，确保每一次实验的配置与结果均可追溯。数据集基于smooth-hierarchy框架构建，该框架专门用于处理层级化的动作识别任务，通过平滑化层级结构提升模型对类别间关系的建模能力。数据集以UCF101为源数据，涵盖了101类人类动作视频，经过预处理后统一为64×64像素的空间分辨率，便于高效训练。此外，数据集与训练流程深度耦合：批量大小为128，训练周期为50个epoch，且支持从最近检查点自动恢复训练，极大提升了实验的容错性与连续性。检查点每隔10分钟自动上传至云端仓库，确保中间结果的安全存储。这种设计使得用户可以轻松复现论文中的核心实验结果，降低研究门槛。

使用方法

使用该数据集进行模型训练时，用户需具备HPC环境及GPU资源。首先确保已获取smooth-hierarchy仓库的指定版本（commit head 348c9cfca3765afb401128a35d361af4b5df3b21），并正确配置虚拟环境与UCF101数据下载。在~/.raca/keys.env文件中设置WANDB_API_KEY和HF_TOKEN用于实验跟踪与模型上传。随后通过运行main.sbatch脚本启动训练，该脚本会自动检测是否存在last.ckpt文件，若有则从中断点恢复训练，否则从头开始50个epoch的训练。训练过程中，模型会定期保存检查点并上传至smooth-hierarchy-ucf101-checkpoints-v1数据集仓库。用户也可直接下载该数据集及其检查点，用于评估或微调预训练模型。该数据集特别适合需要严格复现smooth-hierarchy论文实验场景的研究人员，或希望基于UCF101进行层级化动作识别研究的开发者。

背景与挑战

背景概述

smooth-hierarchy-ucf101-train-reproduce-v1数据集诞生于动作识别领域对可复现性与层级结构建模日益增长的追求之中。该数据集由相关研究团队基于UCF101构建，旨在支持一种名为平滑层级（smooth hierarchy）的创新方法，核心研究问题在于如何通过层级化表示提升视频动作识别的精度与泛化能力。数据集创建于现代高性能计算环境下，依托H200、A100等GPU进行训练，并强调实验的可复现性，每个作业均附带元数据记录。这一数据集不仅为UCF101基准提供了新的训练范式，更推动了动作识别领域向结构化、可复现的研究方向发展。

当前挑战

该数据集面临的挑战首先来自领域内的根本问题：UCF101作为动作识别基准，其视频类别繁多且场景复杂，传统平面分类难以捕捉动作之间的层级关系，而平滑层级方法需在保持识别精度的同时有效组织这些语义结构。在构建过程中，挑战体现在对实验可复现性的高标准要求上，包括确保从源码仓库到环境配置、训练参数（如50轮次、64x64分辨率、128批次大小）的完全一致，以及处理长时间训练中检查点的自动恢复与上传，每个作业还需生成独特的元数据，使得整个复现链条高度依赖计算基础设施的稳定性与文档的精确性。

常用场景

经典使用场景

在视频动作识别与层次化表征学习的交叉领域，smooth-hierarchy-ucf101-train-reproduce-v1数据集为研究者提供了一套完整且可复现的训练基准。该数据集将UCF101中的视频帧以64×64分辨率、批量大小为128的方式进行标准化处理，并依托smooth-hierarchy框架开展长达50轮次的模型训练。其经典使用场景聚焦于验证层次化视频表征的平滑性假设，即通过构建从粗粒度到细粒度的类别层次结构，鼓励模型学习具有内在语义关联的视频特征，从而提升动作识别的泛化能力与鲁棒性。

衍生相关工作

围绕该数据集及相关训练范式，已衍生出一系列具有影响力的研究工作。基于其层次化平滑假设，研究者提出了Smooth Hierarchy Network架构，该网络通过引入层次感知的对比损失函数，在UCF101及其扩展数据集上实现了动作识别的性能突破。后续工作进一步将其思想拓展至视频时序分段与伪标签生成任务，衍生出如Hierarchical Temporal Smoothing Pretraining等方法，推动了视频自监督学习领域的发展。这些工作共同验证了层次化设计在视频理解中的普遍有效性。

数据集最近研究