afmck/peanuts-flan-t5-xl
收藏Hugging Face2023-04-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/afmck/peanuts-flan-t5-xl
下载链接
链接失效反馈官方服务:
资源简介:
花生漫画条数据集(史努比与伙伴们)包含了从1950年10月2日到2000年2月13日的花生漫画条,共提取了77,456个面板,来自17,816条漫画。每个数据行包含图像、面板名称、角色、主题、颜色、年份和描述等字段。数据集大小为约4.4G,可用于商业项目。角色和主题信息从Peanuts Wiki提取,图像从Peanuts Search提取。面板检测和提取使用了特定的代码块,灰度检测和描述生成也有详细的代码说明。
花生漫画条数据集(史努比与伙伴们)包含了从1950年10月2日到2000年2月13日的花生漫画条,共提取了77,456个面板,来自17,816条漫画。每个数据行包含图像、面板名称、角色、主题、颜色、年份和描述等字段。数据集大小为约4.4G,可用于商业项目。角色和主题信息从Peanuts Wiki提取,图像从Peanuts Search提取。面板检测和提取使用了特定的代码块,灰度检测和描述生成也有详细的代码说明。
提供机构:
afmck
原始信息汇总
花生漫画数据集(史努比与伙伴们)
数据集概述
- 许可证:Apache-2.0
- 任务类别:文本到图像
- 语言:英语
- 数据集名称:Peanuts Dataset (Snoopy and Co.)
- 数据集大小:10K<n<100K
数据集信息
- 特征:
image:包含提取面板的图像panel_name:行的唯一标识符characters:包含在漫画面板中的角色元组themes:包含在漫画面板中的主题元组color:指示面板是灰度还是彩色year:面板发布的年份caption:由BLIP-2_FLAN-T5-XL生成的面板描述
数据集拆分
- 训练集:
num_bytes:2947874869.848num_examples:77456
数据集详情
- 时间范围:从1950年10月2日到2000年2月13日
- 面板数量:77,456个面板
- 漫画数量:17,816个漫画
- 数据集大小:约4.4G
数据集字段
image:包含提取面板的PIL.Imagepanel_name:唯一标识符characters:包含在漫画中的角色元组themes:包含在漫画中的主题元组color:指示面板是灰度还是彩色caption:由BLIP-2_FLAN-T5-XL生成的描述year:面板发布的年份
角色和主题信息来源
- 角色和主题信息从Peanuts Wiki (Fandom)提取
- 图像从Peanuts Search提取
提取角色
- "Charlie Brown"
- "Sally Brown"
- "Joe Cool"(史努比的分身)
- "Franklin"
- "Violet Gray"
- "Eudora"
- "Frieda"
- "Marcie"
- "Peppermint Patty"
- "Patty"
- "Pig-Pen"
- "Linus van Pelt"
- "Lucy van Pelt"
- "Rerun van Pelt"
- "Schroeder"
- "Snoopy"
- "Shermy"
- "Spike"
- "Woodstock"
- "the World War I Flying Ace"(史努比的分身)
提取细节
- 面板检测和提取使用OpenCV进行
- 灰度检测使用LAB颜色空间进行
- 描述生成使用BLIP-2管道进行,采用10束搜索和2.0的重复惩罚
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个花生漫画(Snoopy & Co.)数据集,包含从1950年10月2日到2000年2月13日的77,456个漫画面板,总大小约4.4GB。每个面板都配有BLIP-2_FLAN-T5-XL生成的标题,并包含角色、主题、颜色和年份等结构化元数据,适用于文本到图像任务,且采用Apache 2.0许可证,允许商业使用。
以上内容由遇见数据集搜集并总结生成



