PrimeIntellect/c4-tiny
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/PrimeIntellect/c4-tiny
下载链接
链接失效反馈官方服务:
资源简介:
C4 tiny数据集是完整C4数据集的一个非常小的子集,用于测试目的,以避免下载完整数据集。
C4 tiny数据集是完整C4数据集的一个非常小的子集,用于测试目的,以避免下载完整数据集。
提供机构:
PrimeIntellect
原始信息汇总
数据集概述
数据集名称
C4 tiny
数据集描述
这是一个非常小的子集,用于测试,无需下载完整的C4数据集。
数据集特征
- text: 数据类型为字符串
- timestamp: 数据类型为字符串
- url: 数据类型为字符串
数据集分割
- train
- validation
数据文件配置
- en配置
- train: 路径为
en/c4-train.*.json.gz - validation: 路径为
en/c4-validation.*.json.gz
- train: 路径为
许可证
ODC-BY



