VEATIC

github2024-05-08 更新2024-05-31 收录

下载链接：

https://github.com/AlbusPeter/VEATIC

下载链接

链接失效反馈

官方服务：

资源简介：

VEATIC是一个全新的视频情感和影响跟踪数据集，包含124个来自好莱坞电影、纪录片和家庭视频的片段，每帧都有实时标注的连续情感和唤醒度评分。该数据集旨在克服现有数据集的局限性，通过结合情境和角色信息来推断视频帧中选定角色的情感。

VEATIC is a novel video emotion and affect tracking dataset, comprising 124 clips sourced from Hollywood movies, documentaries, and home videos, each frame annotated with continuous emotion and arousal ratings. This dataset is designed to overcome the limitations of existing datasets by inferring the emotions of selected characters in video frames through the integration of contextual and character information.

创建时间：

2023-09-12

原始信息汇总

VEATIC: Video-based Emotion and Affect Tracking in Context Dataset

数据集概述

名称: Video-based Emotion and Affect Tracking in Context Dataset (VEATIC)
内容: 包含124个视频片段，来自好莱坞电影、纪录片和家庭视频，每帧均有实时标注的连续情感和唤醒度评分。
目的: 克服现有情感识别数据集的局限性，提供更全面的情感和上下文信息。
特点: 引入新的计算机视觉任务，通过视频帧中的角色和上下文信息推断所选角色的情感。

数据集结构

视频: 位于dataset/video目录下，格式为${video_id}.mp4。
评分: 平均评分存储在dataset/rating_averaged目录下，格式为${video_id}.csv。
帧: 视频帧存储在dataset/frame目录下，格式为${frame_id}.png。

使用方法

环境要求: 推荐使用Python 3.8及以上版本，建议通过Conda创建环境。
数据下载: 可通过提供的链接下载VEATIC数据集。
视频转帧: 使用video_frame.py脚本将视频转换为帧。

模型训练与测试

预训练模型: 提供预训练模型，该模型在数据集的前98个视频上训练和测试。
训练: 可通过运行train.py脚本进行模型训练，支持从零开始或恢复训练。
测试: 通过运行train.py脚本进行模型测试。

引用信息

引用格式: bibtex @inproceedings{ren2024veatic, title={VEATIC: Video-based Emotion and Affect Tracking in Context Dataset}, author={Ren, Zhihang and Ortega, Jefferson and Wang, Yifan and Chen, Zhimin and Guo, Yunhui and Yu, Stella X and Whitney, David}, booktitle={Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision}, pages={4467--4477}, year={2024} }

搜集汇总

数据集介绍

构建方式

VEATIC数据集的构建基于对视频片段的深入分析，涵盖了来自好莱坞电影、纪录片和家庭视频的124个视频片段。每个视频片段的每一帧都经过实时标注，提供了连续的情感和情感唤醒度评分。这种精细的标注方式使得数据集不仅包含面部表情信息，还结合了上下文环境，从而克服了传统数据集仅依赖单一信息源的局限性。

使用方法

使用VEATIC数据集时，用户首先需要下载数据集并使用提供的脚本将视频转换为帧。数据集的目录结构清晰，便于用户快速定位所需资源。为了进一步利用数据集，用户可以选择下载预训练模型，该模型已在数据集的前98个视频上进行了训练和测试。用户还可以通过运行提供的训练和测试脚本，自定义训练和评估模型，以适应特定的研究需求。

背景与挑战

背景概述

情感识别在心理物理学和计算机视觉领域一直是重要的研究课题。然而，现有的数据集大多局限于面部表情信息，无法全面反映人类情感的复杂性。为了克服这些局限性，Zhihang Ren、Jefferson Ortega等研究人员于2023年推出了VEATIC数据集，这是一个基于视频的情感与情感追踪数据集。VEATIC包含了124个来自好莱坞电影、纪录片和家庭视频的片段，每个帧都通过实时注释提供了连续的情感和唤醒度评分。该数据集不仅为情感识别提供了丰富的上下文信息，还提出了一个新的计算机视觉任务，即通过视频帧中的上下文和角色信息推断情感状态。VEATIC的推出为情感识别研究提供了新的视角，并展示了其在计算机视觉模型泛化能力上的潜力。

当前挑战

VEATIC数据集的构建面临多重挑战。首先，情感和情感追踪的复杂性要求数据集必须包含丰富的上下文信息，而不仅仅是面部表情。其次，实时注释的准确性和一致性是数据集质量的关键，这需要高效的注释工具和严格的质量控制。此外，如何确保数据集的多样性和代表性，以避免模型在特定情境下的过拟合，也是一个重要的挑战。最后，由于情感识别任务的复杂性，模型的训练和评估需要大量的计算资源和时间，这对研究者的计算能力提出了较高的要求。

常用场景

经典使用场景

VEATIC数据集的经典使用场景主要集中在情感与情绪的实时追踪与分析领域。通过提供包含124个视频片段的数据集，VEATIC允许研究者利用视频帧中的上下文信息和角色信息，进行情感和情绪的连续性分析。这一数据集特别适用于开发和验证基于视频的情感识别模型，尤其是在需要考虑复杂场景和多模态信息的情况下。

解决学术问题

VEATIC数据集解决了现有情感识别数据集在上下文信息和多模态数据方面的不足。传统数据集多集中于面部表情，而VEATIC通过引入包含情感和情绪评级的视频帧，为研究者提供了更全面的情感分析工具。这不仅有助于理解人类情感识别的机制，还提升了计算机视觉模型在实际应用中的泛化能力。

实际应用

在实际应用中，VEATIC数据集可广泛应用于心理健康监测、影视内容分析、以及人机交互等领域。例如，在心理健康监测中，通过分析用户在日常生活中的情感变化，可以为心理治疗提供数据支持。在影视内容分析中，VEATIC可以帮助制作团队更好地理解和预测观众的情感反应，从而优化内容创作。

数据集最近研究