five

vidore/tatdqa_test_ocr_chunk

收藏
Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vidore/tatdqa_test_ocr_chunk
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: query dtype: string - name: image_filename dtype: string - name: image dtype: image - name: answer dtype: string - name: answer_type dtype: string - name: page dtype: string - name: model dtype: string - name: prompt dtype: string - name: source dtype: string - name: text_description dtype: string - name: chunk_id dtype: string - name: chunk_type dtype: string - name: chunk_image dtype: image splits: - name: test num_bytes: 4068248953.25 num_examples: 8543 download_size: 201917884 dataset_size: 4068248953.25 configs: - config_name: default data_files: - split: test path: data/test-* ---

数据集信息: 特征字段: - 字段名:查询(query),数据类型:字符串(string) - 字段名:图像文件名(image_filename),数据类型:字符串(string) - 字段名:图像(image),数据类型:图像(image) - 字段名:回答(answer),数据类型:字符串(string) - 字段名:回答类型(answer_type),数据类型:字符串(string) - 字段名:页面(page),数据类型:字符串(string) - 字段名:模型(model),数据类型:字符串(string) - 字段名:提示词(prompt),数据类型:字符串(string) - 字段名:来源(source),数据类型:字符串(string) - 字段名:文本描述(text_description),数据类型:字符串(string) - 字段名:块ID(chunk_id),数据类型:字符串(string) - 字段名:块类型(chunk_type),数据类型:字符串(string) - 字段名:块图像(chunk_image),数据类型:图像(image) 数据划分: - 划分名称:测试集(test),字节数:4068248953.25,样本数量:8543 下载大小:201917884 数据集总大小:4068248953.25 配置项: - 配置名称:默认配置(default),数据文件: - 划分:测试集(test),路径:data/test-*
提供机构:
vidore
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作