CaptionEmporium/danbooru-2021-sfw-dtg-character-tags
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CaptionEmporium/danbooru-2021-sfw-dtg-character-tags
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含98,810个合成角色描述,用于增强检索生成(RAG),特别是在使用视觉语言模型(VLM)进行多角色推理时。描述主要为英文,由Caption Emporium创建,使用DanTagGen-delta-rev2生成,并移除了无关标签以减少性别转换描述的可能性。
该数据集包含98,810个合成角色描述,用于增强检索生成(RAG),特别是在使用视觉语言模型(VLM)进行多角色推理时。描述主要为英文,由Caption Emporium创建,使用DanTagGen-delta-rev2生成,并移除了无关标签以减少性别转换描述的可能性。
提供机构:
CaptionEmporium
原始信息汇总
数据集概述
数据集描述
数据集总结
- 数据集名称: danbooru-2021-sfw-dtg-character-tags
- 数据量: 98,810条合成角色描述
- 来源: 使用DanTagGen-delta-rev2生成,基于anime-caption-danbooru-2021-sfw-5m-hq中的所有角色标签
- 用途: 用于增强检索生成(RAG),特别是在视觉语言模型(VLM)中进行多角色推断时
语言
- 文本语言: 主要为英文
数据分割
| 数据集 | 训练集 |
|---|---|
| danbooru-2021-sfw-dtg-character-tags | 98810 |
数据集创建
生成数据集
-
生成方法: 迭代每个图像的所有角色标签,并使用特定提示生成描述
-
提示示例: py prompt = lambda char, input_tag: f""" rating: safe artist: <|empty|> characters: {char} copyrights: <|empty|> aspect ratio: 1.0 target: <|long|> general: {input_tag}<|input_end|>"""
-
处理步骤: 移除无关标签,如背景简单、白色背景等;处理包含“monochrome”的描述,直至不包含该词;先处理1girl/1boy solo图像,排除包含“genderswap”的标签,再处理群体图像,最后允许剩余角色包含该标签
数据实例
- 示例: json { "character": "cirno", "description": "1girl, blue hair, blue bow, ice wings, white shirt, short sleeves, puffy sleeves, red ribbon, dress, neck ribbon, collared shirt, upper body, blue eyes, smile, ice, closed mouth, medium hair, hair between eyes, bow, wings, blush, hair bow, puffy short sleeves, blue dress, shirt, ribbon, fairy, detached wings, ahoge", }
偏见与限制
- 偏见: 基于DanTagGen训练数据中的已知标签关联
- 限制: 描述未经验证,可能存在错误
附加信息
数据集创建者
- 创建者: Caption Emporium



