swap-uniba/arc_challenge_ita

Name: swap-uniba/arc_challenge_ita
Creator: swap-uniba
Published: 2024-01-19 10:39:33
License: 暂无描述

Hugging Face2024-01-19 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/swap-uniba/arc_challenge_ita

下载链接

链接失效反馈

官方服务：

资源简介：

Arc-c数据集的意大利语版本，包含7,787个科学考试问题，这些问题来自多种来源，主要用于问答和文本生成任务。数据集分为挑战集（2,590个难题）和简单集（5,197个问题），每个问题通常有四个多选答案选项。

提供机构：

swap-uniba

原始信息汇总

数据集概述

基本信息

任务类别: 问答, 文本生成
语言: 意大利语
标签: llm, 评估, llamantino, 意大利语
名称: Arc-c dataset Italian Version
大小类别: 1K<n<10K

数据集描述

内容: 该数据集包含7,787个科学考试问题，来源于多个渠道，包括与AI2相关的研究合作伙伴提供的科学问题。这些问题是纯文本的英语考试问题，涵盖多个年级水平。每个问题具有多项选择结构（通常有4个答案选项）。
分类: 问题分为挑战集（2,590个“难题”）和简单集（5,197个问题）。

引用信息

@misc{basile2023llamantino, title={LLaMAntino: LLaMA 2 Models for Effective Text Generation in Italian Language}, author={Pierpaolo Basile and Elio Musacchio and Marco Polignano and Lucia Siciliani and Giuseppe Fiameni and Giovanni Semeraro}, year={2023}, eprint={2312.09993}, archivePrefix={arXiv}, primaryClass={cs.CL} }

@article{Clark2018ThinkYH, title={Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge}, author={Peter Clark and Isaac Cowhey and Oren Etzioni and Tushar Khot and Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord}, journal={ArXiv}, year={2018}, volume={abs/1803.05457} }

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是ARC挑战数据集的意大利语自动翻译版本，用于评估意大利语语言模型在科学问答任务上的性能。数据集包含多项选择题，规模较小（3行数据），格式为json，适用于问答和文本生成等任务，与LLaMAntino研究项目相关联。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集