BEE-spoke-data/beeweb-5k
收藏Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/BEE-spoke-data/beeweb-5k
下载链接
链接失效反馈官方服务:
资源简介:
BeeWeb-5k是一个用于文本生成任务的英文数据集,包含5000个训练样本。每个样本的特征为文本字符串。数据集的大小类别为1K<n<10K,许可证为odc-by。
BeeWeb-5k是一个用于文本生成任务的英文数据集,包含5000个训练样本。每个样本的特征为文本字符串。数据集的大小类别为1K<n<10K,许可证为odc-by。
提供机构:
BEE-spoke-data
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: ODC-BY
- 大小范围: 1K<n<10K
- 任务类别: 文本生成
数据集详情
-
特征:
- 名称: text
- 数据类型: string
-
分割:
- 名称: train
- 字节数: 39214988
- 示例数: 5000
-
下载大小: 23891016
-
数据集大小: 39214988
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*



