FARAD
收藏Hugging Face2024-09-18 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/RedRocket/FARAD
下载链接
链接失效反馈官方服务:
资源简介:
FARAD数据集是一个文本到图像的数据集,包含约18,000个从Artstation获取的公开图像URL和文本对。这些图像经过质量评估和内容审核,并使用FARAMIR工具和JTP-PILOT²项目进行重新标签。数据集包含18,409张图像,来自4,472个不同的项目,涉及738位艺术家和1,937个不同的标签。数据集可能包含少量未标记的成人或成熟内容,但已尽力避免。数据集遵循CC-BY-NC-SA 4.0许可协议。
创建时间:
2024-09-18
原始信息汇总
FARAD - Furry Aesthetic Realism Annotated Dataset
概述
- 数据集名称: FARAD
- 任务类别: 文本到图像
- 语言: 英语
- 标签: 艺术、 furry、 现实主义、 Artstation、 URL、 图像、 文本、 CSV
- 友好名称: Furry Aesthetic Realism Annotated Dataset
- 数据量: 10K<n<100K
详细信息
- 数据来源: 来自专业艺术作品网站 Artstation 的约18k公开图像URL-文本对。
- 数据筛选: 从约600k furry-adjacent标签的图像中筛选,并通过 FARAMIR 评估质量和内容,使用 JTP-PILOT² 协作重新标记为简化的 e621 标签。
版本 1
- 下载链接: v1/data.csv (5MB)
- 统计信息:
- 18409张图像
- 来自4472个不同项目
- 738位艺术家
- 1937个不同标签
- CSV字段:
url, project, asset, user, width, height, date, likes, title, labels
数据样本
- 示例1:
- 标题: "Toothless - How To Train Your Dragon"
- 艺术家: donchuan3d
- 标签:
3d, how to train your dragon, male feral, night fury, rigging, simple background, solo, stylized, substance painter, toothless, zbrush
- 示例2:
- 标题: "Wolf Portrait (different angle)"
- 艺术家: massimorighi
- 标签:
3d, ambiguous feral, arnold, realistic, simple background, solo, wolf
注意事项
- 数据集中不包含标记为
#NoAI的图像。 - 包含未完成纹理模型的图像,标记为
unfinished。 - 可能包含少量未标记的成人或成熟内容。
许可证
- 许可证: CC-BY-NC-SA 4.0
- 免责声明: 数据集仅包含公开图像的超链接和相关元数据。使用时需遵守所有适用的法律和条款。
搜集汇总
数据集介绍

构建方式
FARAD数据集构建于专业艺术作品展示平台Artstation,从约60万张与毛茸茸动物主题相关的图像中筛选出约1.8万张高质量图像,并通过FARAMIR工具进行质量评估与内容标注。数据集中的图像URL与文本对经过JTP-PILOT²团队的协作重新标注,简化了e621标签系统,确保了数据的多样性与准确性。
特点
FARAD数据集包含1.8万张图像,涵盖4405个独立项目、732位艺术家和1731个独特标签。每张图像均附有详细的元数据,如URL、项目名称、艺术家、分辨率、日期、点赞数、标题及标签。数据集特别注重毛茸茸动物主题的艺术作品,涵盖了从写实到幻想的多维风格,同时避免了包含#NoAI标签的图像,确保了数据的合法性与可用性。
使用方法
FARAD数据集以CSV格式提供,用户可通过下载链接获取数据文件。文件中包含图像URL、项目信息、艺术家、分辨率、日期、点赞数、标题及标签等字段。用户可通过解析CSV文件获取图像链接及元数据,进一步用于文本到图像生成模型的训练与评估。使用过程中需遵守Artstation的服务条款及CC-BY-NC-SA 4.0许可协议,确保合法合规使用。
背景与挑战
背景概述
FARAD(Furry Aesthetic Realism Annotated Dataset)是一个专注于毛茸茸艺术风格与写实主义结合的文本到图像数据集,由RedRocket团队于2023年发布。该数据集包含约18,000个来自Artstation平台的公开图像URL-文本对,涵盖了600,000多个与毛茸茸艺术相关的图像。通过FARAMIR工具进行质量评估,并结合e621标签系统进行协作标注,数据集旨在为艺术创作、图像生成和风格研究提供高质量的资源。FARAD的发布为毛茸茸艺术与写实主义结合的领域提供了重要的数据支持,推动了相关技术在艺术创作与生成模型中的应用。
当前挑战
FARAD数据集在构建与应用中面临多重挑战。首先,数据集的图像来源依赖于Artstation平台,其内容的多样性与质量参差不齐,如何筛选出符合写实主义与毛茸茸艺术风格的高质量图像成为关键问题。其次,尽管FARAMIR工具用于质量评估,但图像内容的复杂性使得自动化标注难以完全准确,仍需人工干预以确保标签的精确性。此外,数据集可能包含少量未标注的成人内容,这对数据集的合规性与适用性提出了更高要求。最后,数据集的使用受限于Artstation的服务条款与CC-BY-NC-SA 4.0许可,如何在合法范围内最大化数据集的科研价值,也是研究者需要面对的挑战。
常用场景
经典使用场景
FARAD数据集在艺术创作与计算机视觉领域具有广泛的应用,尤其是在文本到图像的生成任务中。该数据集通过提供高质量的图像-文本对,为研究人员和开发者提供了丰富的素材,用于训练和评估生成模型。特别是在艺术风格转换、图像生成和图像标注等任务中,FARAD数据集能够帮助模型更好地理解和生成具有艺术美感的图像。
解决学术问题
FARAD数据集解决了艺术图像生成领域中的多个关键问题。首先,它通过提供大量高质量的图像-文本对,解决了训练数据不足的问题。其次,该数据集通过精细的标签系统,帮助模型更好地理解图像内容,从而提高了生成图像的质量和多样性。此外,FARAD数据集还为研究人员提供了一个标准化的基准,用于评估不同生成模型的性能。
衍生相关工作
FARAD数据集衍生了许多相关的研究工作,特别是在文本到图像生成领域。例如,基于FARAD数据集的研究工作包括艺术风格转换、图像生成和图像标注等。这些研究工作不仅推动了生成模型的发展,还为艺术创作和计算机视觉领域提供了新的思路和方法。此外,FARAD数据集还为其他相关数据集的建设提供了参考,促进了该领域的进一步发展。
以上内容由遇见数据集搜集并总结生成



