five

KETI-AIR/kor_race

收藏
Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KETI-AIR/kor_race
下载链接
链接失效反馈
官方服务:
资源简介:
RACE数据集是一个大规模的多项选择阅读理解数据集,源自考试题目。数据集包含文章、问题、答案和选项等特征,适用于多项选择问答任务。数据集分为训练集、验证集和测试集,分别包含87866、4887和4934个样本。数据集仅用于非商业研究目的,所有文章均来自互联网,不属于卡内基梅隆大学的财产。
提供机构:
KETI-AIR
原始信息汇总

数据集概述

基本信息

  • 名称: race
  • 语言: 韩语
  • 大小类别: 1K<n<10K
  • 任务类别: 多项选择
  • 任务ID: 多项选择问答
  • 许可证: other
  • 许可证名称: race
  • 许可证链接: https://www.cs.cmu.edu/~glai1/data/race/

数据集信息

特征

  • data_index_by_user: 数据类型为int32
  • article: 数据类型为string
  • answer: 数据类型为string
  • question: 数据类型为string
  • options: 序列类型为string

数据分割

  • train:
    • 字节数: 191129599
    • 样本数: 87866
  • validation:
    • 字节数: 10507580
    • 样本数: 4887
  • test:
    • 字节数: 10668488
    • 样本数: 4934

下载与数据大小

  • 下载大小: 46954865
  • 数据集大小: 212305667
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作