Windy/sft4rewriter_m0_vs_real
收藏Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Windy/sft4rewriter_m0_vs_real
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练和测试的文本数据,主要特征包括prompt_id(提示ID)、prompt(提示文本)和completion(完成文本)。数据集分为训练集和测试集,训练集包含10212个样本,测试集包含208个样本。数据集的下载大小为22903105字节,总大小为44631924字节。数据文件分为训练数据和测试数据,分别存储在指定的路径下。
This dataset contains text data for training and testing, with main features including prompt_id (prompt ID), prompt (prompt text), and completion (completion text). The dataset is divided into a training set and a test set, with the training set containing 10212 samples and the test set containing 208 samples. The download size of the dataset is 22903105 bytes, and the total size is 44631924 bytes. The data files are divided into training data and test data, stored in specified paths.
提供机构:
Windy
原始信息汇总
数据集概述
数据集特征
- prompt_id: 整数类型 (int64)
- prompt: 字符串类型 (string)
- completion: 字符串类型 (string)
数据集划分
- train:
- 字节数: 43698475
- 样本数: 10212
- test:
- 字节数: 933449
- 样本数: 208
数据集大小
- 下载大小: 22903105 字节
- 数据集总大小: 44631924 字节
配置信息
- 配置名称: default
- 数据文件路径:
- train: data/train-*
- test: data/test-*
- 数据文件路径:



