HiTZ/EusTrivia
收藏Hugging Face2024-04-01 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/EusTrivia
下载链接
链接失效反馈官方服务:
资源简介:
EusTrivia数据集包含1,715个来自多个在线来源的问答题目,其中56.3%为初级水平(3-6年级),其余为挑战性题目。数据集特别关注巴斯克地区、其语言和文化。每个选择题包含2到4个选项,平均3.84个选项,且只有一个正确答案。数据集涵盖了五个知识领域:人文与自然科学、休闲与艺术、音乐、语言与文学、数学与信息通信技术。
EusTrivia数据集包含1,715个来自多个在线来源的问答题目,其中56.3%为初级水平(3-6年级),其余为挑战性题目。数据集特别关注巴斯克地区、其语言和文化。每个选择题包含2到4个选项,平均3.84个选项,且只有一个正确答案。数据集涵盖了五个知识领域:人文与自然科学、休闲与艺术、音乐、语言与文学、数学与信息通信技术。
提供机构:
HiTZ
原始信息汇总
数据集概述
基本信息
- 任务类别: 问答
- 语言: 巴斯克语
- 数据集名称: TriviaEus
- 数据量: 1K<n<10K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: test
- 路径: "triviaeus.jsonl"
数据集详情
- 问题数量: 1,715
- 问题难度: 56.3% 为小学水平(3-6年级),其余为挑战性问题
- 主题聚焦: 大量问题聚焦于巴斯克地区、语言和文化
- 问题类型: 多项选择题,每个问题有2-4个选项(平均3.84个),一个正确答案
- 知识领域:
- 人文与自然科学 (27.8%): 包括历史、地理、生物、生态等
- 休闲与艺术 (24.5%): 包括体育、表演和造型艺术、建筑、文化活动等
- 音乐 (16.0%): 包括古典和当代音乐及音乐家
- 语言与文学 (17.1%): 包括各种文学作品和作家,以及语言学问题(如定义、同义词、词汇使用)
- 数学与ICT (14.5%): 包括数学问题和ICT相关问题,以及对这些领域有贡献的人物
示例
-
巴斯克语示例: txt Galdera: Zenbat kilo dauka tona batek? A. 10.000 kilo B. 1.000.000 kilo C. 1.000 kilo D. 100 kilo Erantzuna: C
-
英语翻译: txt Question: How many kilograms are there in a tonne? A. 10,000 kilos B. 1,000,000 kilos C. 1,000 kilos D. 100 kilos Answer: C
引用
bibtex @misc{etxaniz2024latxa, title={{L}atxa: An Open Language Model and Evaluation Suite for {B}asque}, author={Julen Etxaniz and Oscar Sainz and Naiara Perez and Itziar Aldabe and German Rigau and Eneko Agirre and Aitor Ormazabal and Mikel Artetxe and Aitor Soroa}, year={2024}, eprint={2403.20266}, archivePrefix={arXiv}, primaryClass={cs.CL} }



