five

functionX86/layoutlmv3-cordv2

收藏
Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/functionX86/layoutlmv3-cordv2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含图像、文字、框和标签四个主要特征。图像特征的数据类型为图像,文字特征为字符串序列,框特征为整数序列的序列,标签特征为字符串序列。数据集分为训练集、验证集和测试集三个部分,分别包含800、100和100个样本。数据集的下载大小和数据集大小分别为2307602821和2314531880字节。

The dataset contains four main features: image, words, boxes, and labels. The image feature is of image data type, the words feature is a sequence of strings, the boxes feature is a sequence of sequences of integers, and the labels feature is a sequence of strings. The dataset is divided into three parts: training set, validation set, and test set, containing 800, 100, and 100 samples respectively. The download size and dataset size are 2307602821 and 2314531880 bytes respectively.
提供机构:
functionX86
原始信息汇总

数据集概述

数据集特征

  • image: 图像数据,数据类型为图像。
  • words: 字符串序列,表示文本内容。
  • boxes: 整数序列的序列,表示边界框信息。
  • labels: 字符串序列,表示标签信息。

数据集划分

  • train: 训练集,包含800个样本,大小为1837728763.0字节。
  • validation: 验证集,包含100个样本,大小为242161715.0字节。
  • test: 测试集,包含100个样本,大小为234641402.0字节。

数据集大小

  • 下载大小: 2307602821字节
  • 数据集总大小: 2314531880.0字节

配置信息

  • config_name: default
    • data_files:
      • train: data/train-*
      • validation: data/validation-*
      • test: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作