five

TyDi QA (Typologically Diverse Question Answering)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TyDi_QA
下载链接
链接失效反馈
官方服务:
资源简介:
TyDi QA 是一个问答数据集,涵盖 11 种类型不同的语言,包含 20 万个问答对。 TyDi QA 的语言在其类型学(每种语言表达的语言特征的集合)方面是多种多样的,因此作者希望模型在该集合上表现良好,能够泛化世界上的大量语言。

TyDi QA is a question answering dataset encompassing 11 typologically diverse languages, with a total of 200,000 question-answer pairs. The languages in this dataset vary widely in terms of linguistic typology, which refers to the collection of linguistic features each language exhibits. As such, the authors designed TyDi QA such that models achieving strong performance on it can generalize across a vast array of the world's languages.
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
TyDi QA是一个涵盖11种类型学多样语言的问答数据集,包含20万个问答对。该数据集旨在通过其语言多样性促进模型在多种语言上的泛化能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作