shreyanshu09/Block_Diagram
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/shreyanshu09/Block_Diagram
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是四个框图数据集的组合,包含不同类型的框图图像及其高质量摘要。数据集中的第一个数据集是BD-EnKo数据集,该数据集在ACL 2024上发表的论文《Unveiling the Power of Integration: Block Diagram Summarization through Local-Global Fusion》中引入。其他三个数据集分别是CBD、FC_A和FC_B。数据集中的框图图像来自不同来源,并附有高质量的摘要。训练集和验证集中包含了多种类型的框图,如流程图、图形LR、图形TD、旅程图、序列图、简单图、状态图、C4图、真实世界图等,并分别统计了每种类型在英语和韩语中的数量。
该数据集是四个框图数据集的组合,包含不同类型的框图图像及其高质量摘要。数据集中的第一个数据集是BD-EnKo数据集,该数据集在ACL 2024上发表的论文《Unveiling the Power of Integration: Block Diagram Summarization through Local-Global Fusion》中引入。其他三个数据集分别是CBD、FC_A和FC_B。数据集中的框图图像来自不同来源,并附有高质量的摘要。训练集和验证集中包含了多种类型的框图,如流程图、图形LR、图形TD、旅程图、序列图、简单图、状态图、C4图、真实世界图等,并分别统计了每种类型在英语和韩语中的数量。
提供机构:
shreyanshu09
原始信息汇总
Block Diagram Dataset 概述
数据集基本信息
- 许可证: MIT
- 数据集大小:
- 下载大小: 2276849227 字节
- 数据集大小: 5871850277.481 字节
- 语言: 英语 (en), 韩语 (ko)
- 标签: 块图
- 大小类别: 10K<n<100K
数据集特征
- id: 字符串类型
- image: 图像类型
- ground_truth: 字符串类型
数据集分割
- 训练集:
- 示例数量: 76263
- 字节数: 5038039728.815
- 验证集:
- 示例数量: 8662
- 字节数: 833810548.666
数据集内容
- 数据集包含多种类型的块图图像及其高质量摘要
- 训练集和验证集的详细分类数据如下:
| 类型 | 训练集 (English/Korean) | 验证集 (English/Korean) |
|---|---|---|
| Flowchart | 7,875 / 7,678 | 875 / 854 |
| GraphLR | 5,462 / 2,861 | 607 / 318 |
| GraphTD | 3,500 / 2,402 | 389 / 267 |
| Journey | 8,494 / 8,858 | 942 / 985 |
| Sequence | 2,708 / 3,539 | 301 / 394 |
| Simple Graph | 3,825 / 1,194 | 425 / 133 |
| State Diagram | 6,444 / 6,265 | 717 / 693 |
| C4 | 3,549 / 0 | 395 / 0 |
| Real World | 76 / 304 | 15 / 50 |
| CBD | 396 / 0 | 106 / 0 |
| FC_A | 357 / 0 | 0 / 0 |
| FC_B | 476 / 0 | 196 / 0 |
- 总计:
- 训练集: 43,162 (English) / 33,101 (Korean)
- 验证集: 4,968 (English) / 3,694 (Korean)
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



