functionX86/layoutlmv3-cordv2
收藏Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/functionX86/layoutlmv3-cordv2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像、文字、框和标签四个主要特征。图像特征的数据类型为图像,文字特征为字符串序列,框特征为整数序列的序列,标签特征为字符串序列。数据集分为训练集、验证集和测试集三个部分,分别包含800、100和100个样本。数据集的下载大小和数据集大小分别为2307602821和2314531880字节。
The dataset contains four main features: image, words, boxes, and labels. The image feature is of image data type, the words feature is a sequence of strings, the boxes feature is a sequence of sequences of integers, and the labels feature is a sequence of strings. The dataset is divided into three parts: training set, validation set, and test set, containing 800, 100, and 100 samples respectively. The download size and dataset size are 2307602821 and 2314531880 bytes respectively.
提供机构:
functionX86
原始信息汇总
数据集概述
数据集特征
- image: 图像数据,数据类型为图像。
- words: 字符串序列,表示文本内容。
- boxes: 整数序列的序列,表示边界框信息。
- labels: 字符串序列,表示标签信息。
数据集划分
- train: 训练集,包含800个样本,大小为1837728763.0字节。
- validation: 验证集,包含100个样本,大小为242161715.0字节。
- test: 测试集,包含100个样本,大小为234641402.0字节。
数据集大小
- 下载大小: 2307602821字节
- 数据集总大小: 2314531880.0字节
配置信息
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- data_files:



