five

genta-tech/squad_pairs_indo

收藏
Hugging Face2023-05-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/genta-tech/squad_pairs_indo
下载链接
链接失效反馈
官方服务:
资源简介:
Stanford Question Answering Dataset (SQuAD) 是一个阅读理解数据集,由众包工作者在维基百科文章上提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能是无法回答的。这是一个印尼语翻译版本的SQuAD数据集,翻译自sentence-transformers/embedding-training-data,使用了Helsinki-NLP/opus-mt-en-id进行翻译。

Stanford Question Answering Dataset (SQuAD) 是一个阅读理解数据集,由众包工作者在维基百科文章上提出问题,每个问题的答案是对应阅读段落中的一段文本,或者问题可能是无法回答的。这是一个印尼语翻译版本的SQuAD数据集,翻译自sentence-transformers/embedding-training-data,使用了Helsinki-NLP/opus-mt-en-id进行翻译。
提供机构:
genta-tech
原始信息汇总

数据集概述

数据集名称

Stanford Question Answering Dataset (SQuAD) 的印尼语翻译版本

数据集描述

这是一个阅读理解数据集,包含由众包工作者针对一系列维基百科文章提出的问题。每个问题的答案是相应阅读文章中的文本片段,或者问题可能无法回答。

数据集特性

  • 任务类别:问答
  • 语言:印尼语 (id)
  • 数据集大小:10,000<n<100,000
  • 许可证:CC-BY-4.0

数据集来源

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作