gswamy/pythia-1.4B-tldr-vllm-pair-iter-1

Name: gswamy/pythia-1.4B-tldr-vllm-pair-iter-1
Creator: gswamy
Published: 2024-12-02 20:48:45
License: 暂无描述

Hugging Face2024-12-02 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/gswamy/pythia-1.4B-tldr-vllm-pair-iter-1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征字段，如id、post、title、subreddit、site、article等，涵盖了帖子、标题、子论坛、网站和文章等信息。此外，还包括摘要、选择、工作者、批次、分割、额外信息、查询令牌、查询、响应、响应令牌、响应令牌长度、响应策略、查询响应、查询响应令牌、查询响应令牌长度、查询响应令牌响应标签、策略、迭代最佳查询响应、迭代最差查询响应、迭代最佳掩码、迭代最差掩码、迭代最佳奖励和迭代最差奖励等字段。数据集分为训练集，包含92,858个样本，总大小为4,841,788,931字节。

The dataset contains multiple feature fields such as id, post, title, subreddit, site, article, etc., covering information such as posts, titles, subreddits, websites, and articles. Additionally, it includes summaries, choices, workers, batches, splits, extra information, query tokens, queries, responses, response tokens, response token lengths, response policies, query responses, query response tokens, query response token lengths, query response token response labels, policies, iter best query responses, iter worst query responses, iter best masks, iter worst masks, iter best rewards, and iter worst rewards. The dataset is divided into a training set containing 92,858 samples with a total size of 4,841,788,931 bytes.

提供机构：

gswamy

5,000+

优质数据集

54 个

任务类型

进入经典数据集