five

hosiet/famous-figures-25

收藏
Hugging Face2024-07-06 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/hosiet/famous-figures-25
下载链接
链接失效反馈
官方服务:
资源简介:
我们的数据集包含8,703张25位公众人物的肖像图像及其对应的文本描述。所有图像均从公开的网页资源中爬取。这25位人物包括政治家、电影明星、作家、运动员和商人,涵盖了不同的性别、种族和职业领域。如图11所示,数据集中每位人物的图像数量在400到1,300张之间。数据集分为训练集和测试集,每个子目录包含同一人物的图像,并提供了包含文件名、文本描述和人物名称的元数据CSV文件。图像经过中心裁剪至512×512分辨率,并使用BLIP2模型生成对应的文本描述。

Our dataset contains 8,703 portrait images of 25 public figures and the corresponding text descriptions. All the images were crawled from publicly available sources on the Web. These 25 subjects include politicians, movie stars, writers, athletes and businessmen, with diverse genders, races, and career domains. As shown in Figure 11, the dataset contains 400-1,300 images of each subject. The dataset is divided into training and testing sets, with each subdirectory containing images of the same person and providing a metadata CSV file that includes the filename, text description, and the persons name. The images are center-cropped to a resolution of 512×512, and the corresponding text descriptions are generated using the BLIP2 model.
提供机构:
hosiet
原始信息汇总

Famous-Figures-25 (FF25) Dataset

描述

该数据集包含8,703张25位公众人物的肖像图像及其相应的文本描述。所有图像均从网络上公开可用的来源爬取。这25位人物包括政治家、电影明星、作家、运动员和商人,具有多样化的性别、种族和职业领域。每个主题的图像数量在400到1,300张之间。

数据结构

数据集按以下格式排列:

  • 顶级目录(traintest):划分训练集和测试集。
    • 人物名称:25个子目录,每个子目录包含同一个人的图像。所有目录名称仅包含小写字母和下划线。
    • metadata.csv:提供元数据的CSV文件。包含3列:
      • filename:图像样本的相对路径。
      • text:描述图像样本的生成字幕。
      • name:与图像对应的人物名称。

每张原始图像均被中心裁剪为512×512分辨率。对于每张图像,使用预训练的BLIP2图像字幕生成模型生成相应的文本描述,并通过输入“a photo of <person_name> which shows”来避免幻觉。

数据集信息

  • 特征
    • image:图像数据类型。
    • label:标签数据类型,包含25个类别的名称。
    • text:字符串数据类型。
  • 划分
    • train:训练集,包含8703个样本,大小为2887122362.781字节。
    • test:测试集,包含8714个样本,大小为2912299678.67字节。
  • 下载大小:5868498701字节。
  • 数据集大小:5799422041.451字节。

配置

  • 默认配置
    • train:数据文件路径为data/train-*
    • test:数据文件路径为data/test-*

引用

@article{huang2024freezeasguard, title={FreezeAsGuard: Mitigating Illegal Adaptation of Diffusion Models via Selective Tensor Freezing}, author={Huang, Kai and Gao, Wei}, journal={arXiv preprint arXiv:2405.17472}, year={2024} }

许可证

保留所有权利。对于从互联网收集的图像,版权和许可应参考其原始作者。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作