Tristan/wikipedia_august_october_diff
收藏Hugging Face2022-12-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tristan/wikipedia_august_october_diff
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: url
dtype: string
- name: title
dtype: string
- name: text
dtype: string
- name: crawl_timestamp
dtype: int64
- name: reward
dtype: int64
splits:
- name: train
num_bytes: 17185592921.0
num_examples: 2831474
download_size: 10059329653
dataset_size: 17185592921.0
---
# Dataset Card for "wikipedia_august_october_diff"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Tristan
原始信息汇总
数据集概述
数据集信息
- 特征列表:
id: 数据类型为字符串。url: 数据类型为字符串。title: 数据类型为字符串。text: 数据类型为字符串。crawl_timestamp: 数据类型为64位整数。reward: 数据类型为64位整数。
数据集分割
- 训练集:
- 字节数: 17,185,592,921.0
- 样本数: 2,831,474
数据集大小
- 下载大小: 10,059,329,653
- 数据集大小: 17,185,592,921.0



