five

fedryanto/qas

收藏
Hugging Face2023-07-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fedryanto/qas
下载链接
链接失效反馈
官方服务:
资源简介:
斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者在维基百科文章上提出的问题组成,每个问题的答案是相应阅读段落中的一段文本,或者问题可能是无法回答的。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers,其中answers包含text和answer_start两个子字段。

斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者在维基百科文章上提出的问题组成,每个问题的答案是相应阅读段落中的一段文本,或者问题可能是无法回答的。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers,其中answers包含text和answer_start两个子字段。
提供机构:
fedryanto
原始信息汇总

数据集概述

数据集名称

  • pretty_name: SQuAD

数据集创建者

  • annotations_creators: crowdsourced
  • language_creators: crowdsourced, found

语言

  • language: en

许可证

  • license: cc-by-4.0

多语言性

  • multilinguality: monolingual

大小分类

  • size_categories: 10K<n<100K

源数据集

  • source_datasets: extended|wikipedia

任务类别

  • task_categories: question-answering

任务ID

  • task_ids: extractive-qa

训练与评估索引

  • config: plain_text
  • task: question-answering
  • task_id: extractive_question_answering
  • splits:
    • train_split: train
    • eval_split: validation
  • col_mapping:
    • question: question
    • context: context
    • answers:
      • text: text
      • answer_start: answer_start
  • metrics:
    • type: squad
    • name: SQuAD

数据集信息

  • features:
    • name: id, dtype: string
    • name: title, dtype: string
    • name: context, dtype: string
    • name: question, dtype: string
    • name: answers, sequence:
      • name: text, dtype: string
      • name: answer_start, dtype: int32
  • config_name: plain_text
  • splits:
    • name: train, num_bytes: 79317110, num_examples: 87599
    • name: validation, num_bytes: 10472653, num_examples: 10570
  • download_size: 35142551
  • dataset_size: 89789763
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作