five

shreyanshu09/Block_Diagram

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/shreyanshu09/Block_Diagram
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是四个框图数据集的组合,包含不同类型的框图图像及其高质量摘要。数据集中的第一个数据集是BD-EnKo数据集,该数据集在ACL 2024上发表的论文《Unveiling the Power of Integration: Block Diagram Summarization through Local-Global Fusion》中引入。其他三个数据集分别是CBD、FC_A和FC_B。数据集中的框图图像来自不同来源,并附有高质量的摘要。训练集和验证集中包含了多种类型的框图,如流程图、图形LR、图形TD、旅程图、序列图、简单图、状态图、C4图、真实世界图等,并分别统计了每种类型在英语和韩语中的数量。

该数据集是四个框图数据集的组合,包含不同类型的框图图像及其高质量摘要。数据集中的第一个数据集是BD-EnKo数据集,该数据集在ACL 2024上发表的论文《Unveiling the Power of Integration: Block Diagram Summarization through Local-Global Fusion》中引入。其他三个数据集分别是CBD、FC_A和FC_B。数据集中的框图图像来自不同来源,并附有高质量的摘要。训练集和验证集中包含了多种类型的框图,如流程图、图形LR、图形TD、旅程图、序列图、简单图、状态图、C4图、真实世界图等,并分别统计了每种类型在英语和韩语中的数量。
提供机构:
shreyanshu09
原始信息汇总

Block Diagram Dataset 概述

数据集基本信息

  • 许可证: MIT
  • 数据集大小:
    • 下载大小: 2276849227 字节
    • 数据集大小: 5871850277.481 字节
  • 语言: 英语 (en), 韩语 (ko)
  • 标签: 块图
  • 大小类别: 10K<n<100K

数据集特征

  • id: 字符串类型
  • image: 图像类型
  • ground_truth: 字符串类型

数据集分割

  • 训练集:
    • 示例数量: 76263
    • 字节数: 5038039728.815
  • 验证集:
    • 示例数量: 8662
    • 字节数: 833810548.666

数据集内容

  • 数据集包含多种类型的块图图像及其高质量摘要
  • 训练集和验证集的详细分类数据如下:
类型 训练集 (English/Korean) 验证集 (English/Korean)
Flowchart 7,875 / 7,678 875 / 854
GraphLR 5,462 / 2,861 607 / 318
GraphTD 3,500 / 2,402 389 / 267
Journey 8,494 / 8,858 942 / 985
Sequence 2,708 / 3,539 301 / 394
Simple Graph 3,825 / 1,194 425 / 133
State Diagram 6,444 / 6,265 717 / 693
C4 3,549 / 0 395 / 0
Real World 76 / 304 15 / 50
CBD 396 / 0 106 / 0
FC_A 357 / 0 0 / 0
FC_B 476 / 0 196 / 0
  • 总计:
    • 训练集: 43,162 (English) / 33,101 (Korean)
    • 验证集: 4,968 (English) / 3,694 (Korean)
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作