vidore/tatdqa_test_ocr_chunk
收藏Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/tatdqa_test_ocr_chunk
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: query
dtype: string
- name: image_filename
dtype: string
- name: image
dtype: image
- name: answer
dtype: string
- name: answer_type
dtype: string
- name: page
dtype: string
- name: model
dtype: string
- name: prompt
dtype: string
- name: source
dtype: string
- name: text_description
dtype: string
- name: chunk_id
dtype: string
- name: chunk_type
dtype: string
- name: chunk_image
dtype: image
splits:
- name: test
num_bytes: 4068248953.25
num_examples: 8543
download_size: 201917884
dataset_size: 4068248953.25
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 字段名:查询(query),数据类型:字符串(string)
- 字段名:图像文件名(image_filename),数据类型:字符串(string)
- 字段名:图像(image),数据类型:图像(image)
- 字段名:回答(answer),数据类型:字符串(string)
- 字段名:回答类型(answer_type),数据类型:字符串(string)
- 字段名:页面(page),数据类型:字符串(string)
- 字段名:模型(model),数据类型:字符串(string)
- 字段名:提示词(prompt),数据类型:字符串(string)
- 字段名:来源(source),数据类型:字符串(string)
- 字段名:文本描述(text_description),数据类型:字符串(string)
- 字段名:块ID(chunk_id),数据类型:字符串(string)
- 字段名:块类型(chunk_type),数据类型:字符串(string)
- 字段名:块图像(chunk_image),数据类型:图像(image)
数据划分:
- 划分名称:测试集(test),字节数:4068248953.25,样本数量:8543
下载大小:201917884
数据集总大小:4068248953.25
配置项:
- 配置名称:默认配置(default),数据文件:
- 划分:测试集(test),路径:data/test-*
提供机构:
vidore



