justinpinkney/trailer-faces-hq
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/justinpinkney/trailer-faces-hq
下载链接
链接失效反馈官方服务:
资源简介:
Trailer Faces High Quality (TFHQ) 是一个包含高分辨率人脸图像的大型数据集,这些图像来源于电影预告片。数据集通过从Apple Movie Trailers网站下载预告片,并使用Yolov5-face模型进行人脸检测,然后通过CLIP ViT-B/32和Laplacian方差测量进行图像筛选,最后通过训练分类器进行质量过滤,最终包含186,553张图像。
提供机构:
justinpinkney
原始信息汇总
Trailer Faces HQ (TFHQ) 数据集概述
数据集描述
- 名称: Trailer Faces High Quality (TFHQ)
- 内容: 包含从电影预告片中提取的高分辨率人脸图像的大型数据集。
数据收集
- 来源: 从Apple Movie Trailers网站下载的所有电影预告片和特辑,截至2022年8月。
- 数量: 15,379部预告片,总计约2 TB/507小时视频。
数据处理
- 人脸检测: 使用预训练的Yolov5-face大型模型对每一帧进行人脸检测,排除高度小于256像素或置信度低于0.5的人脸。
- 帧筛选: 通过比较连续帧的图像相似度和锐度(使用预训练的CLIP ViT-B/32模型和拉普拉斯方差测量),选择最清晰的帧。
- 图像对齐: 采用与FFHQ相同的对齐方法。
- 质量过滤: 通过训练一个基于数百个主观评定的“好”/“坏”示例图像的分类器,排除预测为“坏”的图像。
数据集规模
- 最终图像数量: 186,553张
- 图像格式: 质量为95的JPG文件
- 文件命名: 8位零填充数字
引用信息
@misc{pinkney2023tfhq, author = {Pinkney, Justin N. M.}, title = {Trailer Faces HQ}, year={2023}, howpublished= {url{https://huggingface.co/datasets/justinpinkney/trailer-faces-hq/}} }



