shreyanshu09/BD-EnKo
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/shreyanshu09/BD-EnKo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含不同类型的框图图像及其高质量摘要。训练集和验证集中包含了多种类型的框图,如流程图、GraphLR、GraphTD、Journey、Sequence、Simple Graph、State Diagram、C4和Real World,每种类型都有英文和韩文的摘要。具体数量如下:流程图(英文7,875,韩文7,678)、GraphLR(英文5,462,韩文2,861)、GraphTD(英文3,500,韩文2,402)、Journey(英文8,494,韩文8,858)、Sequence(英文2,708,韩文3,539)、Simple Graph(英文3,825,韩文1,194)、State Diagram(英文6,444,韩文6,265)、C4(英文3,549,韩文0)、Real World(英文76,韩文304)。
该数据集包含不同类型的框图图像及其高质量摘要。训练集和验证集中包含了多种类型的框图,如流程图、GraphLR、GraphTD、Journey、Sequence、Simple Graph、State Diagram、C4和Real World,每种类型都有英文和韩文的摘要。具体数量如下:流程图(英文7,875,韩文7,678)、GraphLR(英文5,462,韩文2,861)、GraphTD(英文3,500,韩文2,402)、Journey(英文8,494,韩文8,858)、Sequence(英文2,708,韩文3,539)、Simple Graph(英文3,825,韩文1,194)、State Diagram(英文6,444,韩文6,265)、C4(英文3,549,韩文0)、Real World(英文76,韩文304)。
提供机构:
shreyanshu09
原始信息汇总
BD-EnKo Dataset Summary
Basic Information
- License: MIT
- Features:
id: stringimage: imageground_truth: string
- Splits:
- Train: 75,034 examples, 9,616,619,571.478 bytes
- Validation: 8,360 examples, 746,918,710.6 bytes
- Download Size: 2,177,400,123 bytes
- Dataset Size: 10,363,538,282.078001 bytes
- Languages: English, Korean
- Tags: block diagrams
- Size Categories: 10K<n<100K
Dataset Content
- Types of Block Diagrams:
- Flowchart
- GraphLR
- GraphTD
- Journey
- Sequence
- Simple Graph
- State Diagram
- C4
- Real World
| Types | Train (English) | Train (Korean) | Validation (English) | Validation (Korean) |
|---|---|---|---|---|
| Flowchart | 7,875 | 7,678 | 875 | 854 |
| GraphLR | 5,462 | 2,861 | 607 | 318 |
| GraphTD | 3,500 | 2,402 | 389 | 267 |
| Journey | 8,494 | 8,858 | 942 | 985 |
| Sequence | 2,708 | 3,539 | 301 | 394 |
| Simple Graph | 3,825 | 1,194 | 425 | 133 |
| State Diagram | 6,444 | 6,265 | 717 | 693 |
| C4 | 3,549 | 0 | 395 | 0 |
| Real World | 76 | 304 | 15 | 50 |
| Total | 41,933 | 33,101 | 4,666 | 3,694 |



