five

p1atdev/manga_line_generation

收藏
Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/p1atdev/manga_line_generation
下载链接
链接失效反馈
官方服务:
资源简介:
Manga Line Generation数据集是一个用于图像到文本转换任务的数据集,主要包含漫画中的对话、场景、角色等信息。数据集的特征字段包括卷号、页码、页面内ID、说话者、角色、标题、摘要、帧、图像和文件名等。帧字段进一步包含了帧ID、气泡内内容、气泡外内容、地点、场景和时间等子字段。数据集的语言为日语,任务类别为image-to-text。

Manga Line Generation数据集是一个用于图像到文本转换任务的数据集,主要包含漫画中的对话、场景、角色等信息。数据集的特征字段包括卷号、页码、页面内ID、说话者、角色、标题、摘要、帧、图像和文件名等。帧字段进一步包含了帧ID、气泡内内容、气泡外内容、地点、场景和时间等子字段。数据集的语言为日语,任务类别为image-to-text。
提供机构:
p1atdev
原始信息汇总

数据集概述

数据集名称

  • 名称: Manga Line Generation

数据集特征

  • 特征列表:
    • volume: 数据类型 - string
    • page: 数据类型 - string
    • in_page_id: 数据类型 - string
    • speakers: 数据类型 - sequence of string
    • characters: 数据类型 - sequence of string
    • title: 数据类型 - string
    • summaries: 数据类型 - sequence of string
    • frames: 数据类型 - list
      • frame_id: 数据类型 - string
      • in_bubbles: 数据类型 - list
        • character: 数据类型 - string
        • font: 数据类型 - string
        • tagged_utterance: 数据类型 - string
        • type: 数据类型 - string
        • utterance: 数据类型 - string
      • out_bubbles: 数据类型 - list
        • character: 数据类型 - string
        • font: 数据类型 - string
        • tagged_utterance: 数据类型 - string
        • type: 数据类型 - string
        • utterance: 数据类型 - string
      • place: 数据类型 - string
      • scenes: 数据类型 - list
        • -: 数据类型 - string
        • X: 数据类型 - string
        • other: 数据类型 - string
        • クリス: 数据类型 - string
        • ドロシー: 数据类型 - string
        • ベティちゃん: 数据类型 - string
        • マスター: 数据类型 - string
        • 客A: 数据类型 - string
        • 客B: 数据类型 - string
        • 客C: 数据类型 - string
        • 客D: 数据类型 - string
        • 客E: 数据类型 - string
        • 客F: 数据类型 - string
        • 正体不明の客: 数据类型 - string
        • 男性A: 数据类型 - string
        • 男性B: 数据类型 - string
        • 男性C: 数据类型 - string
        • 警察官A: 数据类型 - string
        • 警察官B: 数据类型 - string
      • time: 数据类型 - string
    • image: 数据类型 - image
    • filename: 数据类型 - string

数据集分割

  • 分割名称: train
  • 数据大小: 119532550 bytes
  • 示例数量: 60

数据集大小

  • 下载大小: 116917626 bytes
  • 数据集大小: 119532550 bytes

语言

  • 语言: ja

任务类别

  • 任务类别: image-to-text

数据集配置

  • 配置名称: default
  • 数据文件路径: data/train-*

许可证

  • 许可证: unknown
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作