genta-tech/squad_pairs_indo
收藏Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/genta-tech/squad_pairs_indo
下载链接
链接失效反馈官方服务:
资源简介:
Stanford Question Answering Dataset (SQuAD) 是一个阅读理解数据集,由众包工作者在维基百科文章上提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能是无法回答的。这是一个印尼语翻译版本的SQuAD数据集,翻译自sentence-transformers/embedding-training-data,使用了Helsinki-NLP/opus-mt-en-id进行翻译。
Stanford Question Answering Dataset (SQuAD) 是一个阅读理解数据集,由众包工作者在维基百科文章上提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能是无法回答的。这是一个印尼语翻译版本的SQuAD数据集,翻译自sentence-transformers/embedding-training-data,使用了Helsinki-NLP/opus-mt-en-id进行翻译。
提供机构:
genta-tech
原始信息汇总
数据集概述
数据集名称
Stanford Question Answering Dataset (SQuAD) 的印尼语翻译版本
数据集描述
这是一个阅读理解数据集,包含由众包工作者针对一系列维基百科文章提出的问题。每个问题的答案是相应阅读文章中的文本片段,或者问题可能无法回答。
数据集特性
- 任务类别:问答
- 语言:印尼语 (id)
- 数据集大小:10,000<n<100,000
- 许可证:CC-BY-4.0
数据集来源
- 原数据集:squad
- 翻译来源:sentence-transformers/embedding-training-data
- 翻译工具:Helsinki-NLP/EN-ID



