five

Lexi/spanextract

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Lexi/spanextract
下载链接
链接失效反馈
官方服务:
资源简介:
斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者基于一组维基百科文章提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能无法回答。数据集的语言为英语,大小为10K到100K之间,任务类别为问答任务,具体为抽取式问答。数据集的许可证为CC-BY-4.0,数据集的创建者为众包工作者,数据集的来源为维基百科。
提供机构:
Lexi
原始信息汇总

数据集概述

数据集基本信息

  • 名称: SQuAD(Stanford Question Answering Dataset)
  • 语言: 英语(en)
  • 许可证: CC-BY-4.0
  • 多语言性: 单语种
  • 大小: 10K<n<100K
  • 源数据集: 扩展自Wikipedia
  • 任务类别: 问答(question-answering)
  • 任务ID: 抽取式问答(extractive-qa)
  • 论文代码ID: squad

数据集结构

  • 数据实例: 包含id, context, question, answers等字段。
    • id: 整型
    • context: 字符串
    • question: 字符串
    • answers: 字典,包含text(字符串)和answer_start(整型)

数据集创建

  • 注释创建者: 众包
  • 语言创建者: 众包和发现
  • 注释过程: 未详细说明
  • 注释者: 未详细说明

使用数据集的考虑

  • 社会影响: 未详细说明
  • 偏见讨论: 未详细说明
  • 其他已知限制: 未详细说明
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作