lucadiliello/STORIES
收藏Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lucadiliello/STORIES
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc
language:
- en
dataset_info:
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 34099206982
num_examples: 945354
- name: dev
num_bytes: 41804891
num_examples: 946
- name: test
num_bytes: 42356443
num_examples: 947
download_size: 15347401118
dataset_size: 34183368316
task_categories:
- fill-mask
- text-generation
pretty_name: STORIES
size_categories:
- 100K<n<1M
---
Original STORIES dataset from the paper [A Simple Method for Commonsense Reasoning](https://arxiv.org/pdf/1806.02847v2.pdf).
提供机构:
lucadiliello
原始信息汇总
数据集概述
基本信息
- 许可证: cc
- 语言: 英语
- 数据集名称: STORIES
数据特征
- 特征名称: text
- 数据类型: 字符串
数据分割
- 训练集:
- 示例数量: 945,354
- 字节数: 340,992,069,820
- 开发集:
- 示例数量: 946
- 字节数: 41,804,891
- 测试集:
- 示例数量: 947
- 字节数: 42,356,443
数据集大小
- 下载大小: 15,347,401,118字节
- 数据集总大小: 341,833,683,160字节
任务类别
- fill-mask
- text-generation
数据集规模
- 规模范围: 100K<n<1M



