KETI-AIR/kor_qasc
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KETI-AIR/kor_qasc
下载链接
链接失效反馈官方服务:
资源简介:
QASC数据集是一个用于问答任务的数据集,特别关注通过句子组合进行问答。数据集包含8134个训练样本、926个验证样本和920个测试样本。每个样本包括问题、选择、答案键、事实信息等特征。数据集的语言为韩语,大小在1K到10K之间,遵循CC BY 4.0许可证。
QASC数据集是一个用于问答任务的数据集,特别关注通过句子组合进行问答。数据集包含8134个训练样本、926个验证样本和920个测试样本。每个样本包括问题、选择、答案键、事实信息等特征。数据集的语言为韩语,大小在1K到10K之间,遵循CC BY 4.0许可证。
提供机构:
KETI-AIR
原始信息汇总
数据集概述
基本信息
- 语言: 韩语 (ko)
- 数据规模: 1K<n<10K
- 任务类别:
- 问答 (question-answering)
- 多选题 (multiple-choice)
- 任务ID:
- 抽取式问答 (extractive-qa)
- 多选题问答 (multiple-choice-qa)
- 许可证: CC BY 4.0
数据集特征
- 特征列表:
data_index_by_user: 数据索引,类型为int32question: 问题,类型为stringchoices: 选项,结构为:text: 文本,序列类型为stringlabel: 标签,序列类型为string
answerKey: 答案键,类型为stringfact1: 事实1,类型为stringfact2: 事实2,类型为stringcombinedfact: 组合事实,类型为stringformatted_question: 格式化问题,类型为string
数据分割
- 训练集:
- 字节数: 5345733
- 样本数: 8134
- 验证集:
- 字节数: 600701
- 样本数: 926
- 测试集:
- 字节数: 404309
- 样本数: 920
数据集大小
- 下载大小: 2385940 字节
- 数据集大小: 6350743 字节



