five

shreyanshu09/BD-EnKo

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/shreyanshu09/BD-EnKo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含不同类型的框图图像及其高质量摘要。训练集和验证集中包含了多种类型的框图,如流程图、GraphLR、GraphTD、Journey、Sequence、Simple Graph、State Diagram、C4和Real World,每种类型都有英文和韩文的摘要。具体数量如下:流程图(英文7,875,韩文7,678)、GraphLR(英文5,462,韩文2,861)、GraphTD(英文3,500,韩文2,402)、Journey(英文8,494,韩文8,858)、Sequence(英文2,708,韩文3,539)、Simple Graph(英文3,825,韩文1,194)、State Diagram(英文6,444,韩文6,265)、C4(英文3,549,韩文0)、Real World(英文76,韩文304)。

该数据集包含不同类型的框图图像及其高质量摘要。训练集和验证集中包含了多种类型的框图,如流程图、GraphLR、GraphTD、Journey、Sequence、Simple Graph、State Diagram、C4和Real World,每种类型都有英文和韩文的摘要。具体数量如下:流程图(英文7,875,韩文7,678)、GraphLR(英文5,462,韩文2,861)、GraphTD(英文3,500,韩文2,402)、Journey(英文8,494,韩文8,858)、Sequence(英文2,708,韩文3,539)、Simple Graph(英文3,825,韩文1,194)、State Diagram(英文6,444,韩文6,265)、C4(英文3,549,韩文0)、Real World(英文76,韩文304)。
提供机构:
shreyanshu09
原始信息汇总

BD-EnKo Dataset Summary

Basic Information

  • License: MIT
  • Features:
    • id: string
    • image: image
    • ground_truth: string
  • Splits:
    • Train: 75,034 examples, 9,616,619,571.478 bytes
    • Validation: 8,360 examples, 746,918,710.6 bytes
  • Download Size: 2,177,400,123 bytes
  • Dataset Size: 10,363,538,282.078001 bytes
  • Languages: English, Korean
  • Tags: block diagrams
  • Size Categories: 10K<n<100K

Dataset Content

  • Types of Block Diagrams:
    • Flowchart
    • GraphLR
    • GraphTD
    • Journey
    • Sequence
    • Simple Graph
    • State Diagram
    • C4
    • Real World
Types Train (English) Train (Korean) Validation (English) Validation (Korean)
Flowchart 7,875 7,678 875 854
GraphLR 5,462 2,861 607 318
GraphTD 3,500 2,402 389 267
Journey 8,494 8,858 942 985
Sequence 2,708 3,539 301 394
Simple Graph 3,825 1,194 425 133
State Diagram 6,444 6,265 717 693
C4 3,549 0 395 0
Real World 76 304 15 50
Total 41,933 33,101 4,666 3,694
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作