sapienzanlp/arc_italian
收藏ARC - Italian (IT) 数据集概述
数据集详情
- 任务类别: 文本生成
- 语言: 意大利语, 英语
- 数据规模: 1K<n<10K
数据集版本
- ARC Challenge:
- 训练集: 1,105 行
- 验证集: 292 行
- 测试集: 1,151 行
- ARC Easy:
- 训练集: 2,2193 行
- 验证集: 557 行
- 测试集: 2,322 行
数据集特点
- 包含多选题和文本补全任务。
- 数据集是英语和意大利语的完全平行版本。
- 翻译过程使用开源工具 🍱 OBenTO-LLM。
数据格式
id: 样本唯一IDcategory: 任务类型,可以是question或text_completioninput_text: 原始英语句子input_text_translation: 意大利语翻译choices: 原始英语选项choice_translations: 意大利语选项翻译gold_index: 正确答案的索引
示例
问题示例
json { "id": "Mercury_SC_407695", "category": "question", "input_text": "Juan and LaKeisha roll a few objects down a ramp. They want to see which object rolls the farthest. What should they do so they can repeat their investigation?", "input_text_translation": "Juan e LaKeisha fanno scivolare alcuni oggetti giù per una rampa. Vogliono vedere quale oggetto scivola più lontano. Cosa dovrebbero fare per ripetere la loro indagine?", "choices": [ "Put the objects in groups.", "Change the height of the ramp.", "Choose different objects to roll.", "Record the details of the investigation." ], "choice_translations": [ "Mettere gli oggetti in gruppi.", "Cambiare laltezza della rampa.", "Scegliere oggetti diversi da scivolare.", "Registrare i dettagli dellindagine." ], "gold_index": 3 }
文本补全示例
json { "id": "Mercury_7217053", "category": "text_completion", "input_text": "Biological evolution can occur through all of these except", "input_text_translation": "Levoluzione biologica può avvenire attraverso tutte queste eccezion fatta", "choices": [ "competition.", "fossilization.", "variation.", "adaptation." ], "choice_translations": [ "concorrenza.", "fossilizzazione.", "variazione.", "adattamento." ], "gold_index": 1 }
许可证
- 许可证: CC BY-SA 4.0



