expertAB
收藏Hugging Face2025-12-08 更新2025-12-09 收录
下载链接:
https://huggingface.co/datasets/icomgpu/expertAB
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从带注释的视频片段中提取的视频帧,以及注释、转录和相应的视频剪辑。数据集结构包括frames(提取的帧,每个片段的第一帧)、segments(每个注释间隔的视频剪辑)、annotations(原始JSON注释)、transcriptions(转录文件,包括full_transcription.txt和每个片段的转录文件)和dataset.csv(帧、视频剪辑、转录和元数据之间的映射)。数据集统计信息显示有24帧、8个片段和1个唯一标签。数据集特征包括image(提取的视频帧,JPEG格式,每个片段的第一帧)、video_segment(相应视频剪辑文件的路径)、transcription(音频片段的文本转录)、subject(动作的主题,如'Учитель'、'Группа учеников')、category(动作的类别,如'Педагогические действия'、'Коммуникативные модальности')、subcategory(子类别,可能包含多个值,用';'分隔)、action_description(动作的描述)和context_and_comments(上下文和附加注释)。
创建时间:
2025-12-08
原始信息汇总
数据集概述
基本信息
- 数据集名称: Video Dataset - consensus-ccnu-01
- 托管地址: https://huggingface.co/datasets/icomgpu/expertAB
- 许可证: mit
- 任务类别: 图像分类, 其他
- 语言: 英语
- 数据规模: 小于1K条样本
数据集描述
该数据集包含从已标注视频片段中提取的视频帧,以及相应的标注、转录文本和对应的视频剪辑。
数据集结构
- 训练集: 包含24个样本
- 数据特征:
image: 提取的视频帧(JPEG格式),为每个片段的第1帧video_segment: 对应视频剪辑文件的路径transcription: 音频片段的文本转录subject: 动作的主体(例如:“Учитель”, “Группа учеников”)category: 动作的类别(例如:“Педагогические действия”, “Коммуникативные модальности”)subcategory: 子类别(可能包含多个值,以“;”分隔)action_description: 动作描述context_and_comments: 上下文和附加评论
文件目录结构
frames/— 提取的帧(每个片段的第1帧)segments/— 每个标注间隔的视频剪辑annotations/— 原始JSON标注文件transcriptions/— 转录文件(full_transcription.txt+ 每个片段的转录)dataset.csv— 帧、视频剪辑、转录和元数据(主体、类别、子类别、动作描述、上下文和评论)之间的映射文件
数据集统计
- 帧数: 24
- 片段数: 8
- 唯一标签数: 1
使用方法
可以使用Hugging Face的datasets库加载此数据集:
python
from datasets import load_dataset
dataset = load_dataset("your-org/video-dataset-consensus-ccnu-01")
搜集汇总
数据集介绍

构建方式
在视频分析领域,expertAB数据集的构建体现了对教育场景中互动行为的精细捕捉。该数据集源自标注的视频片段,通过提取每个片段的首帧图像,并整合对应的视频剪辑、转录文本及多层次元数据。构建过程中,原始JSON标注文件被解析,生成包含图像路径、视频段链接、文字转录以及行为分类信息的结构化CSV文件,确保了数据元素间的系统映射与关联。
特点
expertAB数据集的特点在于其多维度的注释体系,涵盖了从视觉帧、音频转录到行为语义的丰富信息。每一条记录不仅提供视频帧和片段路径,还包含详细的行为主体、类别、子类别描述,以及动作说明和上下文注释,支持对教育互动中“教学行为”与“沟通模式”等复杂概念的深入分析。数据集规模虽小,但注释粒度精细,适用于小样本学习或细粒度行为理解任务。
使用方法
该数据集的使用可通过Hugging Face的datasets库便捷加载,为研究者提供了即用的结构化数据接口。用户可直接调用load_dataset函数加载数据集,进而访问图像、视频段、转录及各类元数据字段。基于其多模态特性,该数据集适用于图像分类、行为识别或跨模态分析等实验,支持从帧级预测到片段级情境理解的研究探索。
背景与挑战
背景概述
在教育技术与人机交互领域,视频数据集对于理解课堂互动与教学行为模式具有关键价值。expertAB数据集由华中师范大学(CCNU)的研究团队创建,旨在通过标注的视频片段、转录文本及元数据,深入分析教学场景中的行为类别与沟通模态。该数据集聚焦于解析教师与学生的互动行为,其核心研究问题在于如何从多模态数据中识别并分类教育行为,从而为智能教育系统提供数据支撑,推动教学评估与辅助工具的智能化发展。
当前挑战
expertAB数据集致力于解决教育视频中行为识别与分类的挑战,这要求模型能够准确理解复杂教学场景下的动作描述与上下文语义。在构建过程中,数据集面临规模有限的制约,仅包含24个样本,这可能导致模型训练中的过拟合风险;同时,多模态数据的对齐与标注一致性也是一大难点,需确保视频帧、音频转录与行为注释之间的精确匹配,以维持数据质量与可靠性。
常用场景
经典使用场景
在计算机视觉与教育技术交叉领域,expertAB数据集以其精细的视频帧与多模态标注,为教学行为分析提供了经典范例。研究者常利用其图像分类与文本转录特征,构建模型以识别课堂中的教师动作、学生互动等教育场景,进而探索教学行为的模式识别与自动标注方法。
实际应用
在实际教育环境中,expertAB数据集支持开发课堂行为自动监测系统,辅助教师进行教学反思与改进。例如,基于其视频片段与转录数据,可构建实时反馈工具,分析教学互动质量,优化课堂管理策略,并为远程教育平台提供智能内容分析功能,提升教学效率与个性化学习体验。
衍生相关工作
围绕expertAB数据集,衍生出多项经典研究工作,包括基于多模态融合的教学行为识别模型、课堂情感计算框架以及教育视频自动摘要系统。这些工作进一步拓展了数据集在教育人工智能、人机交互等领域的应用深度,为后续大规模教育数据集的构建与算法优化奠定了基础。
以上内容由遇见数据集搜集并总结生成



