fedryanto/qas
收藏Hugging Face2023-07-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fedryanto/qas
下载链接
链接失效反馈官方服务:
资源简介:
斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者在维基百科文章上提出的问题组成,每个问题的答案是相应阅读段落中的一段文本,或者问题可能是无法回答的。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers,其中answers包含text和answer_start两个子字段。
斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者在维基百科文章上提出的问题组成,每个问题的答案是相应阅读段落中的一段文本,或者问题可能是无法回答的。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers,其中answers包含text和answer_start两个子字段。
提供机构:
fedryanto
原始信息汇总
数据集概述
数据集名称
- pretty_name: SQuAD
数据集创建者
- annotations_creators: crowdsourced
- language_creators: crowdsourced, found
语言
- language: en
许可证
- license: cc-by-4.0
多语言性
- multilinguality: monolingual
大小分类
- size_categories: 10K<n<100K
源数据集
- source_datasets: extended|wikipedia
任务类别
- task_categories: question-answering
任务ID
- task_ids: extractive-qa
训练与评估索引
- config: plain_text
- task: question-answering
- task_id: extractive_question_answering
- splits:
- train_split: train
- eval_split: validation
- col_mapping:
- question: question
- context: context
- answers:
- text: text
- answer_start: answer_start
- metrics:
- type: squad
- name: SQuAD
数据集信息
- features:
- name: id, dtype: string
- name: title, dtype: string
- name: context, dtype: string
- name: question, dtype: string
- name: answers, sequence:
- name: text, dtype: string
- name: answer_start, dtype: int32
- config_name: plain_text
- splits:
- name: train, num_bytes: 79317110, num_examples: 87599
- name: validation, num_bytes: 10472653, num_examples: 10570
- download_size: 35142551
- dataset_size: 89789763



