KETI-AIR/kor_race
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KETI-AIR/kor_race
下载链接
链接失效反馈官方服务:
资源简介:
RACE数据集是一个大规模的多项选择阅读理解数据集,源自考试题目。数据集包含文章、问题、答案和选项等特征,适用于多项选择问答任务。数据集分为训练集、验证集和测试集,分别包含87866、4887和4934个样本。数据集仅用于非商业研究目的,所有文章均来自互联网,不属于卡内基梅隆大学的财产。
提供机构:
KETI-AIR
原始信息汇总
数据集概述
基本信息
- 名称: race
- 语言: 韩语
- 大小类别: 1K<n<10K
- 任务类别: 多项选择
- 任务ID: 多项选择问答
- 许可证: other
- 许可证名称: race
- 许可证链接: https://www.cs.cmu.edu/~glai1/data/race/
数据集信息
特征
- data_index_by_user: 数据类型为int32
- article: 数据类型为string
- answer: 数据类型为string
- question: 数据类型为string
- options: 序列类型为string
数据分割
- train:
- 字节数: 191129599
- 样本数: 87866
- validation:
- 字节数: 10507580
- 样本数: 4887
- test:
- 字节数: 10668488
- 样本数: 4934
下载与数据大小
- 下载大小: 46954865
- 数据集大小: 212305667



