five

spow12/ko_arc_easy

收藏
Hugging Face2024-06-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/spow12/ko_arc_easy
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: string - name: question dtype: string - name: choices struct: - name: text sequence: string - name: label sequence: string - name: answerKey dtype: string splits: - name: train num_bytes: 693466 num_examples: 2251 - name: validation num_bytes: 175444 num_examples: 570 - name: test num_bytes: 735238 num_examples: 2376 download_size: 818412 dataset_size: 1604148 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* --- # Korean ARC (easy) [davidkim205/ko_arc_easy](https://huggingface.co/datasets/davidkim205/ko_arc_easy) 에 있던 데이터 오류를 수정 수정사항 1. question이 string 이아니라 리스트로 묶여있는 경우 존재 -> string으로 수정 2. answerKey가 ['1', '2', '3', '4'] 로 된 경우가 있음-> ['A', 'B', 'C', 'D']으로 수정 (이것은 원본 데이터가 그럴가능성도 있음.) ## Structure ```jsonl { "id": "Mercury_7175875", "question": "한 천문학자가 운석 충돌 후 행성이 더 빨리 자전하는 것을 관찰했습니다. 이러한 자전 증가의 가장 가능성이 높은 효과는 무엇인가요?", "choices": { "text": [ "행성 밀도가 감소합니다.", "지구의 해는 더 길어질 것입니다.", "지구의 낮이 더 짧아질 것입니다.", "행성의 중력이 더 강해질 것입니다." ], "label": [ "A", "B", "C", "D" ] }, "answerKey": "C" } {...} ```
提供机构:
spow12
原始信息汇总

数据集概述

数据集特征

  • id: 数据类型为字符串(string)。
  • question: 数据类型为字符串(string)。
  • choices: 结构化数据,包含两个序列:
    • text: 数据类型为字符串序列。
    • label: 数据类型为字符串序列。
  • answerKey: 数据类型为字符串(string)。

数据集分割

  • train: 包含2251个示例,总大小为693466字节。
  • validation: 包含570个示例,总大小为175444字节。
  • test: 包含2376个示例,总大小为735238字节。

数据集大小

  • 下载大小: 818412字节。
  • 数据集总大小: 1604148字节。

配置文件

  • config_name: default
  • data_files:
    • train: 路径为data/train-*
    • validation: 路径为data/validation-*
    • test: 路径为data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作