CelebV-Text
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CelebV-Text
下载链接
链接失效反馈官方服务:
资源简介:
CelebV-Text 包含 70,000 个野外面部视频剪辑,涵盖各种视觉内容。 每个视频片段与所提出的半自动文本生成策略生成的 20 个文本配对,能够精确描述静态和动态属性。 我们对 CelebV-Text 的视频、文本和文本-视频相关性进行了全面的统计分析,验证了其优于其他数据集的优势。 此外,我们还进行了广泛的自我评估,以展示 CelebV-Text 的有效性和潜力。 此外,还构建了具有代表性方法的基准,以标准化面部文本到视频生成任务的评估。
CelebV-Text contains 70,000 unconstrained facial video clips covering diverse visual content. Each video clip is paired with 20 text descriptions generated by the proposed semi-automatic text generation strategy, which can accurately characterize both static and dynamic attributes. We conducted comprehensive statistical analyses on the videos, texts, and text-video correlations of CelebV-Text, verifying its advantages over existing datasets. Furthermore, we performed extensive self-evaluations to demonstrate the effectiveness and potential of CelebV-Text. Additionally, we established benchmarks using representative methods to standardize the evaluation of facial text-to-video generation tasks.
提供机构:
OpenDataLab
创建时间:
2023-04-17
搜集汇总
数据集介绍

背景与挑战
背景概述
CelebV-Text是一个包含70,000个野外面部视频剪辑的大规模数据集,每个视频配有20个精确描述静态和动态属性的文本。该数据集专为视频文本预训练和AIGC任务设计,支持面部文本到视频生成任务的标准化评估。
以上内容由遇见数据集搜集并总结生成



