ARIC (Activity Recognition In Classroom)
收藏arXiv2024-10-16 更新2024-10-18 收录
下载链接:
https://ivipclab.github.io/publication ARIC/ARIC
下载链接
链接失效反馈官方服务:
资源简介:
ARIC数据集是由电子科技大学信息与通信工程学院创建的,专注于课堂监控图像中的活动识别。该数据集包含36,453张监控图像,涵盖32种课堂活动,包括听讲、阅读、使用电子设备等。数据集通过多角度监控摄像头从实际课堂环境中采集,确保了数据的多样性和真实性。创建过程中,采用了图像、音频和文本三种模态,以增强特征提取的鲁棒性。ARIC数据集旨在解决课堂活动识别中的类别不平衡和高相似性问题,适用于AI+教育领域的活动识别研究。
The ARIC dataset was developed by the School of Information and Communication Engineering, University of Electronic Science and Technology of China, focusing on activity recognition from classroom monitoring images. This dataset comprises 36,453 surveillance images covering 32 categories of classroom activities, including listening to lectures, reading, using electronic devices, and so on. The dataset was collected from real-world classroom environments via multi-angle monitoring cameras, ensuring the diversity and authenticity of the collected data. During its creation, three modalities including image, audio and text were adopted to enhance the robustness of feature extraction. The ARIC dataset aims to address the issues of class imbalance and high inter-class similarity in classroom activity recognition, and is suitable for activity recognition research in the field of AI+Education.
提供机构:
电子科技大学信息与通信工程学院
创建时间:
2024-10-16
搜集汇总
数据集介绍

构建方式
为了构建ARIC数据集,研究团队在智能教室中通过常规课程期间的高清监控视频捕捉了原始数据。这些视频记录了学生和教师在大小教室环境中从多个角度进行的各种活动。通过使用4K高清摄像机,从教室的前、中、后三个战略位置进行拍摄,确保了数据的清晰度和细节。此外,还提取了10秒的音频片段和使用InternVL模型生成的详细文本描述,形成了图像、音频和文本三种模态的数据。
特点
ARIC数据集具有多视角、多模态和真实课堂场景的特点,涵盖了32种课堂活动,包括听讲、阅读、使用电子设备等。然而,该数据集也面临活动类别样本分布不均的问题,某些常见活动的样本数量远超稀有活动,形成了显著的长尾效应。此外,为了保护隐私,原始图像通过浅层预训练模型转换为特征数据,增加了识别难度。
使用方法
ARIC数据集可用于多种活动识别任务,包括常规活动识别、持续学习和少样本持续学习。研究者可以根据预定义的增量学习设置进行实验,模拟现实世界中新类别随时间出现的场景。数据集还提供了灵活的设置选项,以适应不同的实验需求。通过下载链接,研究者可以获取初步数据并进行进一步分析和研究。
背景与挑战
背景概述
近年来,随着人工智能在教育领域的应用日益受到关注,活动识别技术在课堂环境中的应用也逐渐成为研究热点。然而,现有研究主要集中在手动捕捉的视频中的活动识别,且活动类型有限,很少关注真实课堂监控图像中的活动识别。为了填补这一空白,中国电子科技大学信息与通信工程学院的研究团队创建了ARIC(Activity Recognition In Classroom)数据集。该数据集专注于课堂监控图像中的活动识别,具有多视角、32种活动类别、三种模态以及真实课堂场景等特点。ARIC数据集不仅为一般活动识别任务提供了丰富的数据,还为持续学习和少样本持续学习提供了实验设置,旨在促进开放教学场景的未来分析和研究。
当前挑战
ARIC数据集在构建和应用过程中面临多项挑战。首先,活动类别的样本分布极不平衡,常见活动如听课、阅读和使用手机有数万样本,而较少见的活动如发言、进食和举手仅有数十样本,这种长尾效应增加了识别难度。其次,不同活动类别之间的相似性高,容易导致混淆。此外,为保护隐私,数据集使用了浅层网络提取特征,增加了识别的复杂性。最后,数据集还设置了持续学习和少样本持续学习的实验设置,旨在模拟开放教学场景中活动类型的动态变化,这对模型的适应性和鲁棒性提出了更高的要求。
常用场景
经典使用场景
在教育智能化的背景下,ARIC数据集的经典使用场景主要集中在课堂监控图像中的活动识别。该数据集通过多角度、多模态的方式,捕捉学生在课堂中的各种行为,如听课、阅读、使用电子设备等。这些数据不仅为活动识别算法提供了丰富的训练样本,还为研究者提供了在真实课堂环境中进行活动识别的宝贵资源。通过分析这些数据,研究者可以开发出更精确的活动识别模型,从而提升课堂管理的智能化水平。
实际应用
ARIC数据集在实际应用中具有广泛的前景。首先,它可以用于开发智能课堂管理系统,通过实时识别学生的课堂行为,帮助教师更好地进行课堂管理,提升教学质量。其次,该数据集可以应用于教育数据分析,通过分析学生在课堂中的行为模式,为教育研究提供数据支持,帮助制定更有效的教育策略。此外,ARIC数据集还可以用于开发个性化学习系统,通过识别学生的学习行为,提供个性化的学习建议和反馈。
衍生相关工作
ARIC数据集的发布催生了一系列相关研究工作。首先,基于该数据集,研究者们开发了多种活动识别算法,提升了课堂活动识别的准确性和鲁棒性。其次,ARIC数据集的持续学习和少样本持续学习设置,激发了大量关于持续学习和少样本学习的研究,推动了这些领域的发展。此外,ARIC数据集的多模态特性,也促进了多模态学习与融合的研究,为多模态数据处理提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



