cjaniake/squad_v2_pt
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjaniake/squad_v2_pt
下载链接
链接失效反馈官方服务:
资源简介:
SQuAD2.0_PT数据集是SQuAD2.0的葡萄牙语版本,主要用于问答任务。数据集包含id、title、context、question、is_impossible、answers和plausible_answers等特征。数据集的大小在100K到1M之间,包含训练集和验证集。数据集的创建是通过众包完成的,语言为英语,许可证为Apache-2.0。
SQuAD2.0_PT数据集是SQuAD2.0的葡萄牙语版本,主要用于问答任务。数据集包含id、title、context、question、is_impossible、answers和plausible_answers等特征。数据集的大小在100K到1M之间,包含训练集和验证集。数据集的创建是通过众包完成的,语言为英语,许可证为Apache-2.0。
提供机构:
cjaniake
原始信息汇总
数据集概述
基本信息
- 数据集名称: SQuAD2.0_PT
- 语言: 英语
- 许可证: Apache 2.0
- 多语言性: 单语种
- 数据集大小: 100K<n<1M
- 源数据集: squad_v2
任务类型
- 任务类别: 问答
- 任务ID:
- 开放域问答
- 抽取式问答
数据集配置
- 配置名称: squad_v2
- 训练评估索引:
- 任务: 问答
- 任务ID: 抽取式问答
- 分割:
- 训练分割: train
- 评估分割: validation
- 列映射:
- 问题: question
- 上下文: context
- 答案:
- 文本: text
- 答案开始: answer_start
- 评估指标:
- 类型: squad_v2
- 名称: SQuAD v2
数据集信息
- 特征:
- id: 字符串
- 标题: 字符串
- 上下文: 字符串
- 问题: 字符串
- 是否不可能: 布尔值
- 答案:
- 文本: 字符串
- 答案开始: 整数32位
- 合理答案:
- 文本: 字符串
- 答案开始: 整数32位
- 分割:
- 训练:
- 字节数: 46442822
- 示例数: 130319
- 验证:
- 字节数: 3869431
- 示例数: 11873
- 训练:
- 下载大小: 46494161
- 数据集大小: 128360252



