expertAB

Hugging Face2025-12-08 更新2025-12-09 收录

下载链接：

https://huggingface.co/datasets/icomgpu/expertAB

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从带注释的视频片段中提取的视频帧，以及注释、转录和相应的视频剪辑。数据集结构包括frames（提取的帧，每个片段的第一帧）、segments（每个注释间隔的视频剪辑）、annotations（原始JSON注释）、transcriptions（转录文件，包括full_transcription.txt和每个片段的转录文件）和dataset.csv（帧、视频剪辑、转录和元数据之间的映射）。数据集统计信息显示有24帧、8个片段和1个唯一标签。数据集特征包括image（提取的视频帧，JPEG格式，每个片段的第一帧）、video_segment（相应视频剪辑文件的路径）、transcription（音频片段的文本转录）、subject（动作的主题，如'Учитель'、'Группа учеников'）、category（动作的类别，如'Педагогические действия'、'Коммуникативные модальности'）、subcategory（子类别，可能包含多个值，用';'分隔）、action_description（动作的描述）和context_and_comments（上下文和附加注释）。

创建时间：

2025-12-08

原始信息汇总

数据集概述

基本信息

数据集名称: Video Dataset - consensus-ccnu-01
托管地址: https://huggingface.co/datasets/icomgpu/expertAB
许可证: mit
任务类别: 图像分类, 其他
语言: 英语
数据规模: 小于1K条样本

数据集描述

该数据集包含从已标注视频片段中提取的视频帧，以及相应的标注、转录文本和对应的视频剪辑。

数据集结构

训练集: 包含24个样本
数据特征:
- image: 提取的视频帧（JPEG格式），为每个片段的第1帧
- video_segment: 对应视频剪辑文件的路径
- transcription: 音频片段的文本转录
- subject: 动作的主体（例如：“Учитель”, “Группа учеников”）
- category: 动作的类别（例如：“Педагогические действия”, “Коммуникативные модальности”）
- subcategory: 子类别（可能包含多个值，以“;”分隔）
- action_description: 动作描述
- context_and_comments: 上下文和附加评论

文件目录结构

frames/ — 提取的帧（每个片段的第1帧）
segments/ — 每个标注间隔的视频剪辑
annotations/ — 原始JSON标注文件
transcriptions/ — 转录文件（full_transcription.txt + 每个片段的转录）
dataset.csv — 帧、视频剪辑、转录和元数据（主体、类别、子类别、动作描述、上下文和评论）之间的映射文件

数据集统计

帧数: 24
片段数: 8
唯一标签数: 1

使用方法

可以使用Hugging Face的datasets库加载此数据集： python from datasets import load_dataset dataset = load_dataset("your-org/video-dataset-consensus-ccnu-01")

搜集汇总

数据集介绍

构建方式

在视频分析领域，expertAB数据集的构建体现了对教育场景中互动行为的精细捕捉。该数据集源自标注的视频片段，通过提取每个片段的首帧图像，并整合对应的视频剪辑、转录文本及多层次元数据。构建过程中，原始JSON标注文件被解析，生成包含图像路径、视频段链接、文字转录以及行为分类信息的结构化CSV文件，确保了数据元素间的系统映射与关联。

特点

expertAB数据集的特点在于其多维度的注释体系，涵盖了从视觉帧、音频转录到行为语义的丰富信息。每一条记录不仅提供视频帧和片段路径，还包含详细的行为主体、类别、子类别描述，以及动作说明和上下文注释，支持对教育互动中“教学行为”与“沟通模式”等复杂概念的深入分析。数据集规模虽小，但注释粒度精细，适用于小样本学习或细粒度行为理解任务。

使用方法

该数据集的使用可通过Hugging Face的datasets库便捷加载，为研究者提供了即用的结构化数据接口。用户可直接调用load_dataset函数加载数据集，进而访问图像、视频段、转录及各类元数据字段。基于其多模态特性，该数据集适用于图像分类、行为识别或跨模态分析等实验，支持从帧级预测到片段级情境理解的研究探索。

背景与挑战

背景概述

在教育技术与人机交互领域，视频数据集对于理解课堂互动与教学行为模式具有关键价值。expertAB数据集由华中师范大学（CCNU）的研究团队创建，旨在通过标注的视频片段、转录文本及元数据，深入分析教学场景中的行为类别与沟通模态。该数据集聚焦于解析教师与学生的互动行为，其核心研究问题在于如何从多模态数据中识别并分类教育行为，从而为智能教育系统提供数据支撑，推动教学评估与辅助工具的智能化发展。

当前挑战

expertAB数据集致力于解决教育视频中行为识别与分类的挑战，这要求模型能够准确理解复杂教学场景下的动作描述与上下文语义。在构建过程中，数据集面临规模有限的制约，仅包含24个样本，这可能导致模型训练中的过拟合风险；同时，多模态数据的对齐与标注一致性也是一大难点，需确保视频帧、音频转录与行为注释之间的精确匹配，以维持数据质量与可靠性。

常用场景

经典使用场景

在计算机视觉与教育技术交叉领域，expertAB数据集以其精细的视频帧与多模态标注，为教学行为分析提供了经典范例。研究者常利用其图像分类与文本转录特征，构建模型以识别课堂中的教师动作、学生互动等教育场景，进而探索教学行为的模式识别与自动标注方法。

实际应用

在实际教育环境中，expertAB数据集支持开发课堂行为自动监测系统，辅助教师进行教学反思与改进。例如，基于其视频片段与转录数据，可构建实时反馈工具，分析教学互动质量，优化课堂管理策略，并为远程教育平台提供智能内容分析功能，提升教学效率与个性化学习体验。

衍生相关工作

围绕expertAB数据集，衍生出多项经典研究工作，包括基于多模态融合的教学行为识别模型、课堂情感计算框架以及教育视频自动摘要系统。这些工作进一步拓展了数据集在教育人工智能、人机交互等领域的应用深度，为后续大规模教育数据集的构建与算法优化奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集