five

justinpinkney/trailer-faces-hq

收藏
Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/justinpinkney/trailer-faces-hq
下载链接
链接失效反馈
官方服务:
资源简介:
Trailer Faces High Quality (TFHQ) 是一个包含高分辨率人脸图像的大型数据集,这些图像来源于电影预告片。数据集通过从Apple Movie Trailers网站下载预告片,并使用Yolov5-face模型进行人脸检测,然后通过CLIP ViT-B/32和Laplacian方差测量进行图像筛选,最后通过训练分类器进行质量过滤,最终包含186,553张图像。
提供机构:
justinpinkney
原始信息汇总

Trailer Faces HQ (TFHQ) 数据集概述

数据集描述

  • 名称: Trailer Faces High Quality (TFHQ)
  • 内容: 包含从电影预告片中提取的高分辨率人脸图像的大型数据集。

数据收集

  • 来源: 从Apple Movie Trailers网站下载的所有电影预告片和特辑,截至2022年8月。
  • 数量: 15,379部预告片,总计约2 TB/507小时视频。

数据处理

  • 人脸检测: 使用预训练的Yolov5-face大型模型对每一帧进行人脸检测,排除高度小于256像素或置信度低于0.5的人脸。
  • 帧筛选: 通过比较连续帧的图像相似度和锐度(使用预训练的CLIP ViT-B/32模型和拉普拉斯方差测量),选择最清晰的帧。
  • 图像对齐: 采用与FFHQ相同的对齐方法。
  • 质量过滤: 通过训练一个基于数百个主观评定的“好”/“坏”示例图像的分类器,排除预测为“坏”的图像。

数据集规模

  • 最终图像数量: 186,553张
  • 图像格式: 质量为95的JPG文件
  • 文件命名: 8位零填充数字

引用信息

@misc{pinkney2023tfhq, author = {Pinkney, Justin N. M.}, title = {Trailer Faces HQ}, year={2023}, howpublished= {url{https://huggingface.co/datasets/justinpinkney/trailer-faces-hq/}} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作