stas/openwebtext-synthetic-testing

Name: stas/openwebtext-synthetic-testing
Creator: stas
Published: 2023-11-14 07:31:20
License: 暂无描述

Hugging Face2023-11-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/stas/openwebtext-synthetic-testing

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是从openwebtext-10k中选取的10条记录，用于快速测试，并且可以生成1到1000条记录的重复数据集。每条记录是一个包含多个段落的网页文章。由于该数据集主要用于CI的功能测试，因此没有训练或验证集的分割。

提供机构：

stas

原始信息汇总

数据集概述

python from datasets import load_dataset ds = load_dataset("stas/openwebtext-synthetic-testing", split="10.repeat") print(len(ds)) # 输出10

ds = load_dataset("stas/openwebtext-synthetic-testing", split="1k.repeat") print(len(ds)) # 输出1000

5,000+

优质数据集

54 个

任务类型

进入经典数据集