vwxyzjn/tldr-preference-sft-trl-style
收藏Hugging Face2024-06-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/tldr-preference-sft-trl-style
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,包括prompt、messages、id、subreddit、title、post和summary等。messages字段是一个列表,包含content和role两个子字段。数据集被分为训练集、验证集和测试集,分别包含116722、6447和6553个样本。数据集的下载大小为354613027字节,总大小为587451601字节。
The dataset contains multiple fields, including prompt, messages, id, subreddit, title, post, and summary. The messages field is a list containing two subfields: content and role. The dataset is divided into training, validation, and test sets, containing 116722, 6447, and 6553 samples respectively. The download size of the dataset is 354613027 bytes, and the total size is 587451601 bytes.
提供机构:
vwxyzjn
原始信息汇总
数据集概述
数据集特征
- prompt: 数据类型为字符串。
- messages: 列表类型,包含以下子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- id: 数据类型为字符串。
- subreddit: 数据类型为字符串。
- title: 数据类型为字符串。
- post: 数据类型为字符串。
- summary: 数据类型为字符串。
数据集分割
- train: 包含50个样本,总大小为232729字节。
- validation: 包含50个样本,总大小为232112字节。
- test: 包含50个样本,总大小为219289字节。
数据集大小
- 下载大小: 486396字节。
- 数据集总大小: 684130字节。
数据文件配置
- default 配置下的数据文件路径:
- train:
data/train-* - validation:
data/validation-* - test:
data/test-*
- train:



