GBC Datasets
收藏Graph Based Captioning (GBC) 数据集概述
数据集简介
Graph-based captioning (GBC) 数据集通过连接区域描述来形成图像的结构化、细粒度描述。该数据集包含以下主要功能:
- GBC 数据加载和处理
- GBC 可视化
- GBC 文本到图像生成
- GBC 描述生成
数据加载与处理
数据加载
数据集遵循 GbcGraph 类结构,但推荐使用 GbcGraphFull 类进行操作。可以通过以下方式加载数据:
python from datasets import load_dataset from gbc.data import GbcGraph, GbcGraphFull
ds = load_dataset("graph-based-captions/GBC1M", split="train") # 或 GBC10M gbc_graphs = [] for record in ds.select(range(100)): gbc_graph = GbcGraphFull.model_validate(record) gbc_graphs.append(gbc_graph)
本地文件加载
python from gbc.utils import load_list_from_file from gbc.data import GbcGraphFull
gbc_graphs = load_list_from_file("data/gbc/wiki/wiki_gbc_graphs.jsonl", class_type=GbcGraphFull)
数据处理
提供了数据处理脚本 process_gbc.py,支持文件格式转换、图到文本转换、CLIP/毒性评分计算等功能。
数据集可视化
提供了一个独立的可视化工具,用于交互式探索 GBC 注释数据。
文本到图像生成
支持从简单文本提示生成 GBC 并生成图像。需要安装 t2i 可选依赖项。
描述生成
支持为自定义图像生成 GBC 注释。需要安装 captioning 可选依赖项。
数据集获取
数据集可通过 Hugging Face 获取:🤗 HuggingFace - GBC Datasets




