ilsp/arc_greek
收藏Hugging Face2024-06-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ilsp/arc_greek
下载链接
链接失效反馈官方服务:
资源简介:
ARC Greek数据集是从AI2 ARC数据集机器翻译成希腊语的7776个多项选择题集合。原始数据集包含真实的年级水平科学问题,旨在促进高级问答研究。数据集分为挑战集和简单集,挑战集包含仅由基于检索的算法和词共现算法都回答错误的问题。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。
ARC Greek数据集是从AI2 ARC数据集机器翻译成希腊语的7776个多项选择题集合。原始数据集包含真实的年级水平科学问题,旨在促进高级问答研究。数据集分为挑战集和简单集,挑战集包含仅由基于检索的算法和词共现算法都回答错误的问题。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。
提供机构:
ilsp
原始信息汇总
数据集卡片概述
数据集详情
数据集描述
- 语言(NLP): 希腊语 (el)
- 许可证: cc-by-nc-sa-4.0
数据集配置
ARC-Challenge
- 训练集: 1114 个样本
- 验证集: 299 个样本
- 测试集: 1168 个样本
ARC-Easy
- 训练集: 2249 个样本
- 验证集: 570 个样本
- 测试集: 2376 个样本
数据集结构
-
配置名称: ARC-Challenge
- 训练集路径: ARC-Challenge/train-*
- 验证集路径: ARC-Challenge/validation-*
- 测试集路径: ARC-Challenge/test-*
-
配置名称: ARC-Easy
- 训练集路径: ARC-Easy/train-*
- 验证集路径: ARC-Easy/validation-*
- 测试集路径: ARC-Easy/test-*
数据集创建
- 数据集来源: 从 AI2 ARC 数据集机器翻译而来。
- 数据集分割: 分为 Challenge Set 和 Easy Set。
偏差、风险和限制
- 数据集是通过机器翻译生成的。



