AndyChiang/dgen
收藏Hugging Face2022-10-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AndyChiang/dgen
下载链接
链接失效反馈官方服务:
资源简介:
DGen是一个完形填空问题数据集,涵盖了科学、词汇、常识和琐事等多个领域。它由多个数据集(如SciQ、MCQL、AI2 Science Questions等)编译而成。数据集的具体情况如下表所示:训练集包含2321个问题,验证集包含300个问题,测试集包含259个问题,总共有2880个问题。
pretty_name: DGen
multilinguality:
- 单语种
language:
- 英语(en)
license:
- MIT许可证
size_categories:
- 1000 < 样本量 < 10000
tags:
- 完形填空(cloze)
- SciQ
- MCQL
- AI2科学问答(AI2 Science Questions)
task_categories:
- 掩码填充(fill-mask)
# DGen数据集
**DGen**是一款完形填空(cloze)问题数据集,涵盖科学、词汇、常识与琐事问答多个领域。该数据集汇编自SciQ、MCQL、AI2科学问答等多类公开数据集。DGen数据集的详细统计信息如下表所示:
| DGen数据集 | 训练集 | 验证集 | 测试集 | 总样本数 |
| ---------- | ------ | ------ | ------ | -------- |
| 问题数量 | 2321 | 300 | 259 | 2880 |
数据来源:https://github.com/DRSY/DGen
提供机构:
AndyChiang
原始信息汇总
dgen 数据集概述
基本信息
- 名称: dgen
- 语言: 英语(en)
- 许可证: MIT
- 大小: 1K<n<10K
标签
- cloze
- sciq
- mcql
- ai2 science questions
任务类别
- fill-mask
数据集详情
| 部分 | 训练集 | 验证集 | 测试集 | 总计 |
|---|---|---|---|---|
| 问题数量 | 2321 | 300 | 259 | 2880 |



