Lexi/spanextract

Name: Lexi/spanextract
Creator: Lexi
Published: 2022-10-25 10:08:42
License: 暂无描述

Hugging Face2022-10-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Lexi/spanextract

下载链接

链接失效反馈

官方服务：

资源简介：

斯坦福问答数据集（SQuAD）是一个阅读理解数据集，由众包工作者基于一组维基百科文章提出问题，每个问题的答案是对应阅读段落中的一段文本，或者问题可能无法回答。数据集的语言为英语，大小为10K到100K之间，任务类别为问答任务，具体为抽取式问答。数据集的许可证为CC-BY-4.0，数据集的创建者为众包工作者，数据集的来源为维基百科。

提供机构：

Lexi

原始信息汇总

数据集概述

数据集基本信息

名称: SQuAD（Stanford Question Answering Dataset）
语言: 英语（en）
许可证: CC-BY-4.0
多语言性: 单语种
大小: 10K<n<100K
源数据集: 扩展自Wikipedia
任务类别: 问答（question-answering）
任务ID: 抽取式问答（extractive-qa）
论文代码ID: squad

数据集结构

数据实例: 包含id, context, question, answers等字段。
- id: 整型
- context: 字符串
- question: 字符串
- answers: 字典，包含text（字符串）和answer_start（整型）

数据集创建

注释创建者: 众包
语言创建者: 众包和发现
注释过程: 未详细说明
注释者: 未详细说明

使用数据集的考虑

社会影响: 未详细说明
偏见讨论: 未详细说明
其他已知限制: 未详细说明

5,000+

优质数据集

54 个

任务类型

进入经典数据集