TheTung/squad_es_v2
收藏数据集概述
数据集摘要
自动翻译的斯坦福问答数据集(SQuAD)v2到西班牙语。
支持的任务和排行榜
- 任务类别: 问答
- 任务ID: 抽取式问答
语言
- 语言: 西班牙语
数据集结构
数据实例
v1.1.0
- 下载的数据文件大小: 39.29 MB
- 生成的数据集大小: 94.63 MB
- 总磁盘使用量: 133.92 MB
训练集示例: json { "answers": { "answer_start": [404, 356, 356], "text": ["Santa Clara, California", "Levi s Stadium", "Levi s Stadium en la Bahía de San Francisco en Santa Clara, California."] }, "context": ""El Super Bowl 50 fue un partido de fútbol americano para determinar al campeón de la NFL para la temporada 2015. El campeón de ...", "id": "56be4db0acb8001400a502ee", "question": "¿Dónde tuvo lugar el Super Bowl 50?", "title": "Super Bowl _ 50" }
数据字段
v1.1.0
id: 字符串特征。title: 字符串特征。context: 字符串特征。question: 字符串特征。answers: 字典特征,包含:text: 字符串特征。answer_start: 整数特征。
数据分割
| 名称 | 训练集 | 验证集 |
|---|---|---|
| v1.1.0 | 87595 | 10570 |
数据集创建
数据集策划理由
源数据
初始数据收集和规范化
源语言生产者
标注
标注过程
标注者
个人和敏感信息
使用数据的注意事项
数据集的社会影响
偏见的讨论
其他已知限制
附加信息
数据集策展人
许可信息
SQuAD-es数据集在CC BY 4.0许可下发布。
引用信息
bibtex @article{2016arXiv160605250R, author = {Casimiro Pio , Carrino and Marta R. , Costa-jussa and Jose A. R. , Fonollosa}, title = "{Automatic Spanish Translation of the SQuAD Dataset for Multilingual Question Answering}", journal = {arXiv e-prints}, year = 2019, eid = {arXiv:1912.05200v1}, pages = {arXiv:1912.05200v1}, archivePrefix = {arXiv}, eprint = {1912.05200v2}, }



