SEACrowd/tydiqa
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/tydiqa
下载链接
链接失效反馈官方服务:
资源简介:
TyDi QA是一个问答数据集,涵盖了11种类型多样的语言,包含204K个问答对。这些语言在类型学上具有多样性,即每种语言表达的语言特征集不同,因此我们期望在此数据集上表现良好的模型能够推广到世界上大量语言。该数据集包含了在仅英语语料库中找不到的语言现象。为了提供一个真实的信息寻求任务并避免启动效应,问题是由想要知道答案但还不知道答案的人撰写的,并且数据是直接在每种语言中收集的,没有使用翻译(与MLQA和XQuAD不同)。
TyDi QA是一个问答数据集,涵盖了11种类型多样的语言,包含204K个问答对。这些语言在类型学上具有多样性,即每种语言表达的语言特征集不同,因此我们期望在此数据集上表现良好的模型能够推广到世界上大量语言。该数据集包含了在仅英语语料库中找不到的语言现象。为了提供一个真实的信息寻求任务并避免启动效应,问题是由想要知道答案但还不知道答案的人撰写的,并且数据是直接在每种语言中收集的,没有使用翻译(与MLQA和XQuAD不同)。
提供机构:
SEACrowd



