cjfcsjt/WebSRC-flat
收藏Hugging Face2024-04-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cjfcsjt/WebSRC-flat
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于基于网页的结构化阅读理解任务,包含问答对、页面ID、图像和领域信息。问答对进一步包含答案、ID和问题。数据集分为训练集和验证集,分别包含497和97个示例。数据集的下载大小为23191386字节,数据集大小为26678441字节。数据集的许可证为cc-by-4.0,任务类别为问答,语言为英语。
该数据集用于基于网页的结构化阅读理解任务,包含问答对、页面ID、图像和领域信息。问答对进一步包含答案、ID和问题。数据集分为训练集和验证集,分别包含497和97个示例。数据集的下载大小为23191386字节,数据集大小为26678441字节。数据集的许可证为cc-by-4.0,任务类别为问答,语言为英语。
提供机构:
cjfcsjt
原始信息汇总
数据集概述
数据集特征
- qas:
- answers:
- answer_start: 数据类型为 int64
- element_id: 数据类型为 int64
- text: 数据类型为 string
- id: 数据类型为 string
- question: 数据类型为 string
- answers:
- page_id: 数据类型为 string
- Image: 数据类型为 image
- domain: 数据类型为 string
数据集分割
- train:
- num_bytes: 22537566
- num_examples: 497
- validation:
- num_bytes: 4140875
- num_examples: 97
数据集大小
- download_size: 23191386
- dataset_size: 26678441
配置
- config_name: default
- data_files:
- split: train, path: data/train-*
- split: validation, path: data/validation-*
- data_files:
许可证
- license: cc-by-4.0
任务类别
- task_categories: question-answering
语言
- language: en



