splash-art-gacha-collection-10k|游戏角色立绘数据集|图像生成数据集
收藏Splash Art Collection 10K 数据集概述
数据集基本信息
- 许可证: CC BY-SA 4.0
- 语言: 英语
- 标签: 动漫、游戏、扭蛋、T2I、角色立绘
- 规模: 10K < n < 100K
数据集内容
- 数据来源: 47款扭蛋游戏的角色立绘,主要来自Fandom和Biligame WIKI。
- 数据量: 11,755张角色立绘。
- 适用场景: 适用于微调T2I模型,生成角色立绘。
数据结构
- image: PIL.Image对象,表示不同尺寸的图像。
- prompt: 文本到图像(T2I)生成提示。
- character: 图像中角色的名称。
- title: 与角色相关的标题(如游戏名称)。
- page: 角色页面的参考链接。
- extra: 额外的信息或元数据(JSON字符串)。
数据筛选
- 筛选标准: 图像是否描绘全身角色,使用Qwen2-VL-7B-Instruct进行分类,非全身角色的图像被排除。
数据更新
- 2025.01.02: 数据集首次发布。
- 2025.xx.xx: 计划在不进行额外筛选的情况下,对整个数据集进行FLUX-dev模型的微调。
数据展示
- 展示: 包含多个游戏的示例图像,所有图像均调整为256x256尺寸。
- 分布: 包含标题分布的统计图。
获取T2I提示的步骤
- 图像分类: 将图像分为有背景和无背景两类。
- 生成详细描述: 使用Qwen2-VL-72B-Instruct生成高度详细的图像描述。
- 生成T2I提示: 使用GPT-4o-Mini生成T2I提示,根据背景情况在提示前添加"[splash-art]"或"[splash-art][background]"。
使用示例
python from datasets import load_dataset import json
ds = load_dataset(mrzjy/splash-art-gacha-collection-10k)
for s in ds["train"]: print(s) extra = json.loads(s["extra"]) break
附录
- Qwen2-VL描述生成提示: 包含有背景和无背景图像的详细描述生成提示。
- GPT-4o-Mini T2I提示生成提示: 包含有背景和无背景图像的T2I提示生成提示。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
The MaizeGDB
The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。
www.maizegdb.org 收录
FACED
FACED数据集是由清华大学脑与智能实验室和智能技术与系统国家重点实验室共同创建,包含从123名参与者收集的32通道EEG信号,用于情感计算研究。数据集通过记录参与者观看28个情感诱发视频片段时的EEG信号构建,旨在通过EEG信号分析情感状态。创建过程中,数据经过标准化和统一预处理,设计了四个EEG分类任务。该数据集主要应用于情感识别和脑机接口领域,旨在解决情感计算中的分类问题,提高情感识别的准确性和效率。
arXiv 收录
