Cheremy/arc-challenge-nl
收藏Hugging Face2024-06-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Cheremy/arc-challenge-nl
下载链接
链接失效反馈官方服务:
资源简介:
数据集ai2_arc_nl是原始ai2_arc数据集的荷兰语翻译版本,包含7,787个真实的小学水平的多项选择科学问题。数据集分为挑战集和简单集,挑战集包含那些既不能被基于检索的算法也不能被词共现算法正确回答的问题。数据集还包括超过1400万条与任务相关的科学句子,以及三个神经基线模型的实现。数据集的目的是鼓励在高级问答领域的研究。
数据集ai2_arc_nl是原始ai2_arc数据集的荷兰语翻译版本,包含7,787个真实的小学水平的多项选择科学问题。数据集分为挑战集和简单集,挑战集包含那些既不能被基于检索的算法也不能被词共现算法正确回答的问题。数据集还包括超过1400万条与任务相关的科学句子,以及三个神经基线模型的实现。数据集的目的是鼓励在高级问答领域的研究。
提供机构:
Cheremy
原始信息汇总
数据集概述
数据集名称
- 名称: ai2_arc_nl
数据集摘要
- 摘要: 该数据集包含7,787个真实的荷兰语小学水平的多项选择科学问题,旨在鼓励高级问答研究。数据集分为挑战集和简易集,其中挑战集仅包含被检索算法和词共现算法错误回答的问题。
支持的任务
- 任务: 问答
语言
- 语言: 荷兰语 (nl)
数据集结构
数据实例
- 示例: json { "answerKey": "B", "choices": { "label": ["A", "B", "C", "D"], "text": ["Shady areas increased.", "Food sources increased.", "Oxygen levels increased.", "Available water increased."] }, "id": "Mercury_SC_405487", "question": "Een jaar begonnen de eiken bomen in het park meer , the oak trees in a park began producing more acorns than usual. The next year, the population of chipmunks in the park also increased. Which best explains why there were more chipmunks the next year?" }
数据字段
- 字段:
id: 字符串类型question: 字符串类型choices: 结构体,包含:label: 序列,字符串类型text: 序列,字符串类型
answerKey: 字符串类型
数据分割
- 分割:
名称 训练 验证 测试 ARC-Challenge 1119 299 1172 ARC-Easy 2251 570 2376
数据集创建
数据来源
- 来源: 原始ai2_arc数据集
数据处理
- 处理: 使用GPT4-o将数据翻译成荷兰语



