RiTA-nlp/ai2_arc_ita

Name: RiTA-nlp/ai2_arc_ita
Creator: RiTA-nlp
Published: 2024-04-23 21:21:48
License: 暂无描述

Hugging Face2024-04-23 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/RiTA-nlp/ai2_arc_ita

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是Ai2 ARC的意大利语机器翻译版本，使用了TowerInstruct-7B-v0.2进行翻译。数据集包含两个配置：ARC-Challenge和ARC-Easy，每个配置都有训练、测试和验证集，且每个样本包含id、问题、选项和答案键。数据集的详细信息、用途、结构、创建过程、注释、偏见和风险等方面尚未提供详细信息。

提供机构：

RiTA-nlp

原始信息汇总

数据集概述

名称: Ai2 ARC ita
语言: 意大利语
许可: CC-BY 4.0
任务类别:
- 问答
- 多选题问答
任务ID:
- open-domain-qa
- multiple-choice-qa
数据集大小: 1K<n<10K
多语言性: 单语种

数据集配置

ARC-Challenge

特征:
- id: 字符串
- question: 字符串
- choices: 序列
  - text: 字符串
  - label: 字符串
- answerKey: 字符串
分割:
- train: 1119个样本
- test: 1172个样本
- validation: 299个样本

ARC-Easy

特征:
- id: 字符串
- question: 字符串
- choices: 序列
  - text: 字符串
  - label: 字符串
- answerKey: 字符串
分割:
- train: 2251个样本
- test: 2376个样本
- validation: 570个样本

数据集文件

ARC-Challenge

训练数据: ARC-Challenge/train.parquet
测试数据: ARC-Challenge/test.parquet
验证数据: ARC-Challenge/validation.parquet

ARC-Easy

训练数据: ARC-Easy/train.parquet
测试数据: ARC-Easy/test.parquet
验证数据: ARC-Easy/validation.parquet

5,000+

优质数据集

54 个

任务类型

进入经典数据集