mrm8488/FloCo

Name: mrm8488/FloCo
Creator: mrm8488
Published: 2023-09-10 23:24:25
License: 暂无描述

Hugging Face2023-09-10 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mrm8488/FloCo

下载链接

链接失效反馈

官方服务：

资源简介：

FloCo是一个新的大规模数据集，用于流程图图像到Python代码的转换。它包含了11,884对流程图-代码样本。更多关于统计数据和数据集构建的详细信息，请参考相关论文。

FloCo is a novel large-scale dataset designed for the conversion from flowchart images to Python code. It contains 11,884 paired flowchart-code samples. For more detailed statistics and information regarding dataset construction, please refer to the associated paper.

提供机构：

mrm8488

原始信息汇总

FloCo 数据集

概述

FloCo 数据集是一个用于流程图图像到Python代码转换的大型数据集，包含11,884个流程图-代码样本对。

配置信息

test 配置
- 特征
  - image: 图像类型
  - code_caption: 字符串类型
- 分割
  - train: 1188个样本，142,134,244.412字节
- 下载大小: 124,563,800字节
- 数据集大小: 142,134,244.412字节
train 配置
- 特征
  - image: 图像类型
  - code_caption: 字符串类型
- 分割
  - train: 10,102个样本，946,697,073.77字节
- 下载大小: 853,815,350字节
- 数据集大小: 946,697,073.77字节
validation 配置
- 特征
  - image: 图像类型
  - code_caption: 字符串类型
- 分割
  - train: 594个样本，95,790,792字节
- 下载大小: 73,916,515字节
- 数据集大小: 95,790,792字节

数据文件

test 配置
- train: test/train-*
train 配置
- train: train/train-*
validation 配置
- train: validation/train-*

任务类别

图像到图像

数据集名称

FloCo

数据集大小类别

10K<n<100K

搜集汇总

数据集介绍

构建方式

在计算机视觉与程序生成交叉领域，FloCo数据集通过系统化流程构建而成。该数据集从公开资源中收集了丰富的流程图图像，并经由专业标注人员将其精确转化为对应的Python代码片段，最终形成11,884个高质量的图像-代码配对样本。构建过程注重数据对齐的准确性，确保每个流程图与其代码表示在语义和逻辑上严格一致，为模型训练提供了可靠的基础。

特点

FloCo数据集的核心特点在于其规模与专业性。作为专注于流程图至代码转换的大规模资源，它涵盖了多样化的流程图风格与复杂程度，代码标注均采用规范的Python语法。数据集结构清晰，划分为训练、验证与测试子集，便于模型开发与评估。其图像与文本的配对设计，直接支持跨模态学习任务，为视觉语言理解研究提供了重要支撑。

使用方法

该数据集主要应用于图像到代码的生成与理解任务。研究人员可通过加载标准化的数据分割，直接将其输入到深度学习模型中进行端到端训练，例如基于编码器-解码器架构的序列生成模型。在评估阶段，利用独立的测试集可以客观衡量模型将流程图解析为可执行代码的准确性与泛化能力，推动自动化编程辅助工具的发展。

背景与挑战

背景概述

在文档分析与视觉语言理解领域，将视觉图表转化为可执行代码一直是极具价值的研究方向。FloCo数据集由Shreya Shukla等研究人员于2023年构建，并在国际文档分析与识别会议（ICDAR）上发布，旨在解决流程图图像到Python代码的自动转换问题。该数据集包含11,884个配对的流程图-代码样本，为开发端到端的图像到代码生成模型提供了关键资源，推动了文档图像理解与程序合成技术的交叉融合，对教育辅助工具和自动化软件开发工具的发展产生了积极影响。

当前挑战

FloCo数据集致力于攻克流程图图像自动解析与代码生成的复杂挑战，其核心在于准确识别流程图的视觉元素（如形状、箭头、文本）并将其映射为结构化的程序逻辑。在构建过程中，研究人员面临数据收集与标注的艰巨性，需要确保流程图图像的多样性与代码语义的精确对应，同时处理手绘与规范图表间的风格差异。此外，模型需克服视觉噪声、布局变异以及编程逻辑的抽象表达等难题，以实现鲁棒且通用的跨模态转换。

常用场景

经典使用场景

在计算机视觉与程序生成交叉领域，FloCo数据集为流程图图像到Python代码的转换任务提供了基准资源。该数据集通过包含上万对流程图与代码的配对样本，支持研究者训练和评估端到端的视觉语言模型，旨在实现从视觉图表到结构化编程语言的自动解析与生成。这一场景典型地应用于教育技术、自动化编程辅助等前沿方向，为模型理解复杂视觉逻辑并转化为可执行代码奠定了数据基础。

衍生相关工作

围绕FloCo数据集，已衍生出多项经典研究工作。例如，基于其构建的端到端神经网络模型，如结合卷积神经网络（CNN）与序列到序列（Seq2Seq）架构的方法，显著提升了流程图识别的准确率与代码生成的流畅性。此外，研究者利用该数据集探索了多模态预训练策略，将视觉特征与程序语言表示对齐，推动了如VL2G等项目的发展。这些工作不仅丰富了图像到代码转换的技术栈，还为文档理解领域的基准测试设立了新标准。

数据集最近研究