VEATIC|视频情感分析数据集|情感跟踪数据集
收藏VEATIC: Video-based Emotion and Affect Tracking in Context Dataset
数据集概述
- 名称: Video-based Emotion and Affect Tracking in Context Dataset (VEATIC)
- 内容: 包含124个视频片段,来自好莱坞电影、纪录片和家庭视频,每帧均有实时标注的连续情感和唤醒度评分。
- 目的: 克服现有情感识别数据集的局限性,提供更全面的情感和上下文信息。
- 特点: 引入新的计算机视觉任务,通过视频帧中的角色和上下文信息推断所选角色的情感。
数据集结构
- 视频: 位于
dataset/video
目录下,格式为${video_id}.mp4
。 - 评分: 平均评分存储在
dataset/rating_averaged
目录下,格式为${video_id}.csv
。 - 帧: 视频帧存储在
dataset/frame
目录下,格式为${frame_id}.png
。
使用方法
- 环境要求: 推荐使用Python 3.8及以上版本,建议通过Conda创建环境。
- 数据下载: 可通过提供的链接下载VEATIC数据集。
- 视频转帧: 使用
video_frame.py
脚本将视频转换为帧。
模型训练与测试
- 预训练模型: 提供预训练模型,该模型在数据集的前98个视频上训练和测试。
- 训练: 可通过运行
train.py
脚本进行模型训练,支持从零开始或恢复训练。 - 测试: 通过运行
train.py
脚本进行模型测试。
引用信息
- 引用格式: bibtex @inproceedings{ren2024veatic, title={VEATIC: Video-based Emotion and Affect Tracking in Context Dataset}, author={Ren, Zhihang and Ortega, Jefferson and Wang, Yifan and Chen, Zhimin and Guo, Yunhui and Yu, Stella X and Whitney, David}, booktitle={Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision}, pages={4467--4477}, year={2024} }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录