KETI-AIR/kor_cosmos_qa
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KETI-AIR/kor_cosmos_qa
下载链接
链接失效反馈官方服务:
资源简介:
CosmosQA是一个韩语机器阅读理解数据集,专注于上下文常识推理。数据集包含上下文、问题、四个答案选项及正确答案标签。数据集分为训练、验证和测试三个部分,总计包含超过3万个例子。数据集遵循CC BY 4.0许可。
CosmosQA是一个韩语机器阅读理解数据集,专注于上下文常识推理。数据集包含上下文、问题、四个答案选项及正确答案标签。数据集分为训练、验证和测试三个部分,总计包含超过3万个例子。数据集遵循CC BY 4.0许可。
提供机构:
KETI-AIR
原始信息汇总
数据集概述
基本信息
- 名称: CosmosQA
- 语言: 韩语
- 许可证: CC BY 4.0
- 数据量: 10K<n<100K
数据集结构
特征
- data_index_by_user: 数据索引(int32)
- context: 上下文(string)
- question: 问题(string)
- answer0: 答案0(string)
- answer1: 答案1(string)
- answer2: 答案2(string)
- answer3: 答案3(string)
- label: 标签(int32)
分割
- 训练集:
- 字节数: 20787557
- 样本数: 25262
- 验证集:
- 字节数: 2246371
- 样本数: 2985
- 测试集:
- 字节数: 6186162
- 样本数: 6963
大小
- 下载大小: 11150870 字节
- 数据集大小: 29220090 字节



