MinnieTang/NOTA-dataset
收藏Hugging Face2024-07-05 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MinnieTang/NOTA-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括id、image、prompt和answer。数据集分为多个分割,包括test_analysis、test_IE、test_region、train_IE、train_analysis和train_alignment。每个分割都有对应的字节大小和示例数量。数据集的总下载大小为39581875字节,总数据集大小为218092200字节。数据集的配置文件指定了每个分割的数据文件路径。
This dataset contains multiple features, including id, image, prompt, and answer. The dataset is divided into several splits, including test_analysis, test_IE, test_region, train_IE, train_analysis, and train_alignment. Each split has corresponding byte sizes and example counts. The total download size of the dataset is 39581875 bytes, and the total dataset size is 218092200 bytes. The configuration file of the dataset specifies the data file paths for each split.
提供机构:
MinnieTang
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为
int32 - image: 数据类型为
string - prompt: 数据类型为
string - answer: 数据类型为
string
数据集分割
- test_analysis: 包含 700 个样本,占用 686122 字节
- test_IE: 包含 11112 个样本,占用 3610057 字节
- test_region: 包含 9150 个样本,占用 3432083 字节
- train_IE: 包含 657686 个样本,占用 205444144 字节
- train_analysis: 包含 766 个样本,占用 944812 字节
- train_alignment: 包含 28125 个样本,占用 3974982 字节
数据集大小
- 下载大小: 39581875 字节
- 总大小: 218092200 字节
配置
- config_name: default
- data_files:
- test_analysis: 路径为
data/test_analysis-* - test_IE: 路径为
data/test_IE-* - test_region: 路径为
data/test_region-* - train_IE: 路径为
data/train_IE-* - train_analysis: 路径为
data/train_analysis-* - train_alignment: 路径为
data/train_alignment-*
- test_analysis: 路径为
- data_files:



