five

afmck/peanuts-flan-t5-xl

收藏
Hugging Face2023-04-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/afmck/peanuts-flan-t5-xl
下载链接
链接失效反馈
官方服务:
资源简介:
花生漫画条数据集(史努比与伙伴们)包含了从1950年10月2日到2000年2月13日的花生漫画条,共提取了77,456个面板,来自17,816条漫画。每个数据行包含图像、面板名称、角色、主题、颜色、年份和描述等字段。数据集大小为约4.4G,可用于商业项目。角色和主题信息从Peanuts Wiki提取,图像从Peanuts Search提取。面板检测和提取使用了特定的代码块,灰度检测和描述生成也有详细的代码说明。

花生漫画条数据集(史努比与伙伴们)包含了从1950年10月2日到2000年2月13日的花生漫画条,共提取了77,456个面板,来自17,816条漫画。每个数据行包含图像、面板名称、角色、主题、颜色、年份和描述等字段。数据集大小为约4.4G,可用于商业项目。角色和主题信息从Peanuts Wiki提取,图像从Peanuts Search提取。面板检测和提取使用了特定的代码块,灰度检测和描述生成也有详细的代码说明。
提供机构:
afmck
原始信息汇总

花生漫画数据集(史努比与伙伴们)

数据集概述

  • 许可证:Apache-2.0
  • 任务类别:文本到图像
  • 语言:英语
  • 数据集名称:Peanuts Dataset (Snoopy and Co.)
  • 数据集大小:10K<n<100K

数据集信息

  • 特征
    • image:包含提取面板的图像
    • panel_name:行的唯一标识符
    • characters:包含在漫画面板中的角色元组
    • themes:包含在漫画面板中的主题元组
    • color:指示面板是灰度还是彩色
    • year:面板发布的年份
    • caption:由BLIP-2_FLAN-T5-XL生成的面板描述

数据集拆分

  • 训练集
    • num_bytes:2947874869.848
    • num_examples:77456

数据集详情

  • 时间范围:从1950年10月2日到2000年2月13日
  • 面板数量:77,456个面板
  • 漫画数量:17,816个漫画
  • 数据集大小:约4.4G

数据集字段

  • image:包含提取面板的PIL.Image
  • panel_name:唯一标识符
  • characters:包含在漫画中的角色元组
  • themes:包含在漫画中的主题元组
  • color:指示面板是灰度还是彩色
  • caption:由BLIP-2_FLAN-T5-XL生成的描述
  • year:面板发布的年份

角色和主题信息来源

  • 角色和主题信息从Peanuts Wiki (Fandom)提取
  • 图像从Peanuts Search提取

提取角色

  • "Charlie Brown"
  • "Sally Brown"
  • "Joe Cool"(史努比的分身)
  • "Franklin"
  • "Violet Gray"
  • "Eudora"
  • "Frieda"
  • "Marcie"
  • "Peppermint Patty"
  • "Patty"
  • "Pig-Pen"
  • "Linus van Pelt"
  • "Lucy van Pelt"
  • "Rerun van Pelt"
  • "Schroeder"
  • "Snoopy"
  • "Shermy"
  • "Spike"
  • "Woodstock"
  • "the World War I Flying Ace"(史努比的分身)

提取细节

  • 面板检测和提取使用OpenCV进行
  • 灰度检测使用LAB颜色空间进行
  • 描述生成使用BLIP-2管道进行,采用10束搜索和2.0的重复惩罚
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个花生漫画(Snoopy & Co.)数据集,包含从1950年10月2日到2000年2月13日的77,456个漫画面板,总大小约4.4GB。每个面板都配有BLIP-2_FLAN-T5-XL生成的标题,并包含角色、主题、颜色和年份等结构化元数据,适用于文本到图像任务,且采用Apache 2.0许可证,允许商业使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作