cfpark00/toy-multistep-nn_10-na_10-nab_10-seed_2

Name: cfpark00/toy-multistep-nn_10-na_10-nab_10-seed_2
Creator: cfpark00
Published: 2025-04-07 07:15:53
License: 暂无描述

Hugging Face2025-04-07 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/cfpark00/toy-multistep-nn_10-na_10-nab_10-seed_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个包含提示文本和完成文本配对的数据集，用于训练和测试自然语言处理模型。每个样本包括一个提示文本（prompts）、一个完成文本（completions）、一个表示被遮蔽的单词数量的整数（num_maskeds）和一个文本内容（texts）。数据集分为训练集、测试集（有两个版本：test_rl和test），每个集合包含262144个样本。

This dataset is a collection of prompt-completion pairs for training and testing natural language processing models. Each sample includes a prompt text (prompts), a completion text (completions), an integer indicating the number of masked words (num_maskeds), and a text content (texts). The dataset is split into a training set and two test sets (test_rl and test), each containing 262144 samples.

提供机构：

cfpark00

5,000+

优质数据集

54 个

任务类型

进入经典数据集