five

ilsp/arc_greek

收藏
Hugging Face2024-06-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ilsp/arc_greek
下载链接
链接失效反馈
官方服务:
资源简介:
ARC Greek数据集是从AI2 ARC数据集机器翻译成希腊语的7776个多项选择题集合。原始数据集包含真实的年级水平科学问题,旨在促进高级问答研究。数据集分为挑战集和简单集,挑战集包含仅由基于检索的算法和词共现算法都回答错误的问题。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。

ARC Greek数据集是从AI2 ARC数据集机器翻译成希腊语的7776个多项选择题集合。原始数据集包含真实的年级水平科学问题,旨在促进高级问答研究。数据集分为挑战集和简单集,挑战集包含仅由基于检索的算法和词共现算法都回答错误的问题。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。
提供机构:
ilsp
原始信息汇总

数据集卡片概述

数据集详情

数据集描述

  • 语言(NLP): 希腊语 (el)
  • 许可证: cc-by-nc-sa-4.0

数据集配置

ARC-Challenge

  • 训练集: 1114 个样本
  • 验证集: 299 个样本
  • 测试集: 1168 个样本

ARC-Easy

  • 训练集: 2249 个样本
  • 验证集: 570 个样本
  • 测试集: 2376 个样本

数据集结构

  • 配置名称: ARC-Challenge

    • 训练集路径: ARC-Challenge/train-*
    • 验证集路径: ARC-Challenge/validation-*
    • 测试集路径: ARC-Challenge/test-*
  • 配置名称: ARC-Easy

    • 训练集路径: ARC-Easy/train-*
    • 验证集路径: ARC-Easy/validation-*
    • 测试集路径: ARC-Easy/test-*

数据集创建

  • 数据集来源:AI2 ARC 数据集机器翻译而来。
  • 数据集分割: 分为 Challenge Set 和 Easy Set。

偏差、风险和限制

  • 数据集是通过机器翻译生成的。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作