five

BIWI, Multiface, 3DMEAD|计算机视觉数据集|面部识别数据集

收藏
github2025-02-16 更新2025-02-18 收录
计算机视觉
面部识别
下载链接:
https://github.com/galib360/face-benchmark-project
下载链接
链接失效反馈
资源简介:
BIWI数据集、Multiface数据集、3DMEAD数据集
创建时间:
2025-01-23
原始信息汇总

"Wild West" of Evaluating Speech-Driven 3D Facial Animation Synthesis: A Benchmark Study

数据集概述

数据集名称

  • 无具体数据集名称,本研究涉及多个数据集

数据集描述

  • 本研究旨在对语音驱动的3D面部动画合成技术进行基准测试,评估确定性模型和非确定性模型的性能。
  • 使用了多个数据集,包括BIWI、Multiface和3DMEAD,以一致的评价指标和实验设置进行基准测试。

数据集组成

模型列表

  • FaceFormer: 训练在BIWI、Multiface和3DMEAD数据集上,代码脚本位于./Datasets/目录。
  • CodeTalker: 训练在BIWI、Multiface和3DMEAD数据集上,代码脚本位于./Datasets/目录。
  • FaceXHuBERT: 训练在BIWI、Multiface和3DMEAD数据集上,代码脚本位于./Datasets/目录。
  • FaceDiffuser: 训练在BIWI、Multiface和3DMEAD数据集上,代码脚本位于./Datasets/目录。
  • ProbTalk3D: 训练在3DMEAD数据集上。

训练细节

  • 硬件: 使用Linux系统,配备AMD EPYC 7313 CPU和Nvidia A16 GPU,1TB RAM。
  • 数据预处理: 参考各数据集对应的README文件。

评估

  • 定量评估: 使用精心选择的客观评价指标,详细信息参考./Evaluation/README.md

引用

  • 如果本研究对您的研究工作有用,请考虑引用以下信息(注意:bibtex信息尚未最终确定,获取DOI后将更改):

    @article{HaquePavlouYumak_EG2025, journal = {Computer Graphics Forum}, title = {{"Wild West" of Evaluating Speech-Driven 3D Facial Animation Synthesis: A Benchmark Study}}, author = {Haque, Kazi Injamamul and Pavlou, Alkiviadis and Yumak, Zerrin}, year = {2025}, publisher = {The Eurographics Association and John Wiley & Sons Ltd.}, ISSN = {}, DOI = {} }

版权

AI搜集汇总
数据集介绍
main_image_url
构建方式
BIWI、Multiface和3DMEAD数据集均是根据特定预处理流程构建而成,旨在为语音驱动的3D面部动画合成提供标准化的评估方法。BIWI数据集的构建借鉴了CodeTalker的方法,Multiface数据集的构建则参照了FaceDiffuser的流程,而3DMEAD数据集采用了EMOTE的指导原则,通过这些流程确保了数据集的质量和一致性。
特点
该数据集的特点在于其多样性和综合性。BIWI、Multiface和3DMEAD三个数据集涵盖了不同类型和来源的面部动画数据,能够全面评估语音驱动的3D面部动画合成方法的性能。此外,数据集的构建考虑了多种客观指标,并通过用户感知研究来验证主观指标与客观指标的相关性,增强了评估的全面性和准确性。
使用方法
使用这些数据集时,用户需遵循相应的预处理和划分策略,这些策略在相关模型的GitHub仓库中有详细说明。用户可以根据自己的需要,选择合适的数据集和模型,调整路径并替换或编辑代码脚本以进行训练。此外,数据集的使用还应遵循其各自的许可协议,确保研究的合法性和合规性。
背景与挑战
背景概述
BIWI、Multiface、3DMEAD这三个数据集,是研究语音驱动的3D面部动画合成领域的重要资源。该研究背景起源于近年来音频驱动3D面部动画技术的快速进展,学术界和工业界对此领域的研究均展现出浓厚的兴趣。本研究由Haque、Pavlou和Yumak等研究人员开展,旨在对现有方法进行基准测试,并解决当前研究领域中缺乏标准化评价方法的问题。研究采用了多种先进模型,并对这些模型在一致性实验设置下的性能进行了评估。该研究对相关领域产生了重要影响,为后续研究提供了可靠的数据集和评价标准。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:一是缺乏统一的评价标准,导致研究之间的比较困难;二是数据集和客观评价指标的选择存在较大差异,使得评价过程复杂化;三是主观感知指标与客观指标之间缺乏相关性,需要对此进行深入分析。此外,模型在不同数据集上的排名结果不具有普遍性,主观评价指标的评分与客观指标也不总是一致,这为后续研究带来了新的挑战。
常用场景
经典使用场景
BIWI, Multiface, 3DMEAD数据集在3D面部动画合成领域具有重要的应用价值,其经典使用场景在于为语音驱动的3D面部动画合成模型提供标准化、一致性的评估基准。这些数据集通过精心挑选的客观指标和一致的实验设置,为各类模型提供了公平且具可比性的测试环境。
解决学术问题
该数据集解决了长期以来在3D面部动画合成研究中缺乏统一评价标准的问题,避免了因实验设置差异导致的评估结果不一致性,为学术研究提供了可量化的、客观的评估方法,有助于推动该领域技术的标准化发展。
衍生相关工作
基于这些数据集,学术界和工业界衍生出了一系列相关研究工作,如FaceFormer、CodeTalker、FaceXHuBERT、FaceDiffuser和ProbTalk3D等模型,它们在语音驱动的3D面部动画合成领域取得了显著进展,推动了相关技术的创新与发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

FAOSTAT

FAOSTAT provides time-series data about agriculture, nutrition, fisheries, forestry and food aid by country and region from 1961 to present. FAOSTAT is a multilingual database. Data can be searched, browsed, and downloaded.

re3data.org 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

PU Dataset

德国帕德博恩大学(PU)轴承故障诊断数据集提供了丰富的轴承故障信号数据,包括内圈、外圈和滚动体故障等多种类型的轴承故障。与其他数据集相比,PU数据集的特色在于包含了大量的电机驱动系统故障数据,为轴承故障诊断研究提供了一个全面的实验平台。

github 收录