jihuny/tldr_1.4b_10k_gopt_policy_unnorm_penul_prev_1e6_iter0

Name: jihuny/tldr_1.4b_10k_gopt_policy_unnorm_penul_prev_1e6_iter0
Creator: jihuny
Published: 2025-11-03 13:43:30
License: 暂无描述

Hugging Face2025-11-03 更新2025-11-15 收录

下载链接：

https://hf-mirror.com/datasets/jihuny/tldr_1.4b_10k_gopt_policy_unnorm_penul_prev_1e6_iter0

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了提示文本(prompt)、索引(prompt_idx)、选择的文本(chosen)、被拒绝的文本(rejected)、分数(score)、对数概率(logprob)、完成原因(finish_reason)、嵌入向量差(embedding_difference)等字段。数据集分为训练集(train)，共有10000个示例。

The dataset includes fields such as prompt, prompt_idx, chosen, rejected, score, logprob, finish_reason, embedding_difference, etc. The dataset is split into a training set (train) with a total of 10,000 examples.

提供机构：

jihuny

5,000+

优质数据集

54 个

任务类型

进入经典数据集