seokheeyam/funsd-bank-paragraph-test3-encoded
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/seokheeyam/funsd-bank-paragraph-test3-encoded
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征:labels(标签)、input_ids(输入ID)、attention_mask(注意力掩码)和normalized_bboxes(归一化边界框)。标签包括四个类别:other、header、question和answer。数据集分为训练集和测试集,训练集包含125个样本,测试集包含15个样本。数据集的下载大小为145748字节,总大小为3514560字节。配置部分指定了训练集和测试集的数据文件路径。
提供机构:
seokheeyam
原始信息汇总
数据集概述
数据集特征
- labels: 分类标签,包含以下类别:
- 0: other
- 1: header
- 2: question
- 3: answer
- input_ids: 序列数据类型为
int32。 - attention_mask: 序列数据类型为
int8。 - normalized_bboxes: 序列数据类型为
int64。
数据集分割
- train: 包含125个样本,占用3138000字节。
- test: 包含15个样本,占用376560字节。
数据集大小
- 下载大小: 145748字节。
- 数据集总大小: 3514560字节。
配置文件
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为



