nunorc/squad_v1_pt
收藏Hugging Face2024-07-17 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/nunorc/squad_v1_pt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是SQuAD数据集的葡萄牙语翻译版本,使用Google Cloud API自动翻译。数据集主要用于问答任务,包括抽取式问答和开放域问答。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers。
该数据集是SQuAD数据集的葡萄牙语翻译版本,使用Google Cloud API自动翻译。数据集主要用于问答任务,包括抽取式问答和开放域问答。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers。
提供机构:
nunorc
原始信息汇总
数据集概述
基本信息
- 名称: SquadV1Pt
- 语言: 葡萄牙语(pt)
- 许可证: MIT
- 多语言性: 单语种
- 数据集大小: 10K<n<100K
- 源数据: 原始数据
- 任务类别: 问答
- 任务ID:
- extractive-qa
- open-domain-qa
数据集结构
- 数据实例:
- 字段:
id: 字符串title: 字符串context: 字符串question: 字符串answers: 字典,包含text: 字符串answer_start: 整数
- 数据分割:
train: 87599个实例validation: 10570个实例
- 字段:
数据集创建
- 注释创建者: 众包
- 语言创建者: 众包
- 翻译过程: 使用Google Cloud API自动翻译
数据集使用考虑
- 许可证: MIT,允许广泛使用和分发。
附加信息
- 贡献者:
- @thomwolf
- @albertvillanova
- @lewtun
- @patrickvonplaten



