Lexi/spanextract
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Lexi/spanextract
下载链接
链接失效反馈官方服务:
资源简介:
斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由众包工作者基于一组维基百科文章提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能无法回答。数据集的语言为英语,大小为10K到100K之间,任务类别为问答任务,具体为抽取式问答。数据集的许可证为CC-BY-4.0,数据集的创建者为众包工作者,数据集的来源为维基百科。
提供机构:
Lexi
原始信息汇总
数据集概述
数据集基本信息
- 名称: SQuAD(Stanford Question Answering Dataset)
- 语言: 英语(en)
- 许可证: CC-BY-4.0
- 多语言性: 单语种
- 大小: 10K<n<100K
- 源数据集: 扩展自Wikipedia
- 任务类别: 问答(question-answering)
- 任务ID: 抽取式问答(extractive-qa)
- 论文代码ID: squad
数据集结构
- 数据实例: 包含
id,context,question,answers等字段。id: 整型context: 字符串question: 字符串answers: 字典,包含text(字符串)和answer_start(整型)
数据集创建
- 注释创建者: 众包
- 语言创建者: 众包和发现
- 注释过程: 未详细说明
- 注释者: 未详细说明
使用数据集的考虑
- 社会影响: 未详细说明
- 偏见讨论: 未详细说明
- 其他已知限制: 未详细说明



