Paper2Fig100k

arXiv2025-09-30 收录

下载链接：

https://github.com/joanrod/ocr-vqgan

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由来自研究论文中的图-文对组成，用于训练和验证文本到图形生成模型。该数据集对于训练潜在扩散模型至关重要，这种模型能够根据文本描述生成科学图表。数据集的规模包括81,194个训练样本和21,259个验证样本，其任务专注于文本到图形的生成。

This dataset consists of graph-text pairs sourced from research papers, and is utilized for training and validating text-to-graph generation models. It is critical for training latent diffusion models, which are capable of generating scientific diagrams based on textual descriptions. The dataset includes 81,194 training samples and 21,259 validation samples, with its task focusing on text-to-graph generation.

搜集汇总

数据集介绍

背景与挑战

背景概述

OCR-VQGAN是一个专注于生成包含清晰文本的图像编码器，其核心创新是引入了OCR感知损失函数。配套的Paper2Fig100k数据集包含10万+科研论文图表，特别适合文本-图像生成任务的研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集