VEATIC|视频情感分析数据集|情感跟踪数据集

github2024-05-08 更新2024-05-31 收录

视频情感分析

情感跟踪

下载链接：

https://github.com/AlbusPeter/VEATIC

下载链接

链接失效反馈

资源简介：

VEATIC是一个全新的视频情感和影响跟踪数据集，包含124个来自好莱坞电影、纪录片和家庭视频的片段，每帧都有实时标注的连续情感和唤醒度评分。该数据集旨在克服现有数据集的局限性，通过结合情境和角色信息来推断视频帧中选定角色的情感。

VEATIC is a novel video emotion and affect tracking dataset, comprising 124 clips sourced from Hollywood movies, documentaries, and home videos, each frame annotated with continuous emotion and arousal ratings. This dataset is designed to overcome the limitations of existing datasets by inferring the emotions of selected characters in video frames through the integration of contextual and character information.

创建时间：

2023-09-12

原始信息汇总

VEATIC: Video-based Emotion and Affect Tracking in Context Dataset

数据集概述

名称: Video-based Emotion and Affect Tracking in Context Dataset (VEATIC)
内容: 包含124个视频片段，来自好莱坞电影、纪录片和家庭视频，每帧均有实时标注的连续情感和唤醒度评分。
目的: 克服现有情感识别数据集的局限性，提供更全面的情感和上下文信息。
特点: 引入新的计算机视觉任务，通过视频帧中的角色和上下文信息推断所选角色的情感。

数据集结构

视频: 位于dataset/video目录下，格式为${video_id}.mp4。
评分: 平均评分存储在dataset/rating_averaged目录下，格式为${video_id}.csv。
帧: 视频帧存储在dataset/frame目录下，格式为${frame_id}.png。

使用方法

环境要求: 推荐使用Python 3.8及以上版本，建议通过Conda创建环境。
数据下载: 可通过提供的链接下载VEATIC数据集。
视频转帧: 使用video_frame.py脚本将视频转换为帧。

模型训练与测试

预训练模型: 提供预训练模型，该模型在数据集的前98个视频上训练和测试。
训练: 可通过运行train.py脚本进行模型训练，支持从零开始或恢复训练。
测试: 通过运行train.py脚本进行模型测试。

引用信息

引用格式: bibtex @inproceedings{ren2024veatic, title={VEATIC: Video-based Emotion and Affect Tracking in Context Dataset}, author={Ren, Zhihang and Ortega, Jefferson and Wang, Yifan and Chen, Zhimin and Guo, Yunhui and Yu, Stella X and Whitney, David}, booktitle={Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision}, pages={4467--4477}, year={2024} }

AI搜集汇总

数据集介绍

构建方式

VEATIC数据集的构建基于对视频片段的深入分析，涵盖了来自好莱坞电影、纪录片和家庭视频的124个视频片段。每个视频片段的每一帧都经过实时标注，提供了连续的情感和情感唤醒度评分。这种精细的标注方式使得数据集不仅包含面部表情信息，还结合了上下文环境，从而克服了传统数据集仅依赖单一信息源的局限性。

使用方法

使用VEATIC数据集时，用户首先需要下载数据集并使用提供的脚本将视频转换为帧。数据集的目录结构清晰，便于用户快速定位所需资源。为了进一步利用数据集，用户可以选择下载预训练模型，该模型已在数据集的前98个视频上进行了训练和测试。用户还可以通过运行提供的训练和测试脚本，自定义训练和评估模型，以适应特定的研究需求。

背景与挑战

背景概述

情感识别在心理物理学和计算机视觉领域一直是重要的研究课题。然而，现有的数据集大多局限于面部表情信息，无法全面反映人类情感的复杂性。为了克服这些局限性，Zhihang Ren、Jefferson Ortega等研究人员于2023年推出了VEATIC数据集，这是一个基于视频的情感与情感追踪数据集。VEATIC包含了124个来自好莱坞电影、纪录片和家庭视频的片段，每个帧都通过实时注释提供了连续的情感和唤醒度评分。该数据集不仅为情感识别提供了丰富的上下文信息，还提出了一个新的计算机视觉任务，即通过视频帧中的上下文和角色信息推断情感状态。VEATIC的推出为情感识别研究提供了新的视角，并展示了其在计算机视觉模型泛化能力上的潜力。

当前挑战

VEATIC数据集的构建面临多重挑战。首先，情感和情感追踪的复杂性要求数据集必须包含丰富的上下文信息，而不仅仅是面部表情。其次，实时注释的准确性和一致性是数据集质量的关键，这需要高效的注释工具和严格的质量控制。此外，如何确保数据集的多样性和代表性，以避免模型在特定情境下的过拟合，也是一个重要的挑战。最后，由于情感识别任务的复杂性，模型的训练和评估需要大量的计算资源和时间，这对研究者的计算能力提出了较高的要求。

常用场景

经典使用场景

VEATIC数据集的经典使用场景主要集中在情感与情绪的实时追踪与分析领域。通过提供包含124个视频片段的数据集，VEATIC允许研究者利用视频帧中的上下文信息和角色信息，进行情感和情绪的连续性分析。这一数据集特别适用于开发和验证基于视频的情感识别模型，尤其是在需要考虑复杂场景和多模态信息的情况下。

解决学术问题

VEATIC数据集解决了现有情感识别数据集在上下文信息和多模态数据方面的不足。传统数据集多集中于面部表情，而VEATIC通过引入包含情感和情绪评级的视频帧，为研究者提供了更全面的情感分析工具。这不仅有助于理解人类情感识别的机制，还提升了计算机视觉模型在实际应用中的泛化能力。

实际应用

在实际应用中，VEATIC数据集可广泛应用于心理健康监测、影视内容分析、以及人机交互等领域。例如，在心理健康监测中，通过分析用户在日常生活中的情感变化，可以为心理治疗提供数据支持。在影视内容分析中，VEATIC可以帮助制作团队更好地理解和预测观众的情感反应，从而优化内容创作。

数据集最近研究

最新研究方向

在情感与情绪识别领域，VEATIC数据集的引入为研究者提供了全新的视角。该数据集通过整合来自好莱坞电影、纪录片及家庭视频的124个视频片段，结合每帧的实时情感标注，突破了传统数据集仅依赖面部表情信息的局限。VEATIC不仅推动了情感识别机制的深入理解，还为计算机视觉模型在通用场景中的泛化能力提供了有力支持。当前，VEATIC的研究方向主要集中在通过上下文信息与角色特征的结合，提升情感识别的准确性与鲁棒性。这一研究不仅在心理学与计算机视觉的交叉领域具有重要意义，还为情感计算与智能交互系统的开发提供了坚实的基础。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

中国行政区划数据

本项目为中国行政区划数据，包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局，存储格式为sqlite3 db文件，支持直接使用数据库连接工具打开。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集，包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素，标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建，包含约80,000帧从10小时无人机拍摄视频中精选的图像，覆盖多种复杂城市环境。数据集主要关注车辆目标，每帧均标注了边界框及多达14种属性，如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究，解决高密度、小目标、相机运动等挑战，适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录