asas-ai/tydiqa-ar-primary_task
收藏Hugging Face2024-04-01 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/tydiqa-ar-primary_task
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个阿拉伯语的问答数据集,名为tydiqa-ar,使用Apache 2.0许可证。数据集包含训练集和验证集,分别有23092和1380个样本。数据集的特征包括passage_answer_candidates、question_text、document_title、language、annotations、document_plaintext和document_url等,适用于问答任务。
该数据集是一个阿拉伯语的问答数据集,名为tydiqa-ar,使用Apache 2.0许可证。数据集包含训练集和验证集,分别有23092和1380个样本。数据集的特征包括passage_answer_candidates、question_text、document_title、language、annotations、document_plaintext和document_url等,适用于问答任务。
提供机构:
asas-ai
原始信息汇总
数据集概述
基本信息
- 名称: tydiqa-ar
- 语言: 阿拉伯语 (ar)
- 许可证: Apache-2.0
- 任务类别: 问答 (question-answering)
配置
- 默认配置:
- 训练数据路径: data/train-*
- 验证数据路径: data/validation-*
数据集特征
- passage_answer_candidates:
- plaintext_start_byte: int32
- plaintext_end_byte: int32
- question_text: string
- document_title: string
- language: string
- annotations:
- passage_answer_candidate_index: int32
- minimal_answers_start_byte: int32
- minimal_answers_end_byte: int32
- yes_no_answer: string
- document_plaintext: string
- document_url: string
数据集统计
- 训练集:
- 字节数: 767894331.3564428
- 样本数: 23092
- 验证集:
- 字节数: 35803153.66148902
- 样本数: 1380
- 下载大小: 364886604
- 数据集大小: 803697485.0179318



