jihuny/tldr_1.4b_10k_gopt_policy_unnorm_penul_prev_1e6_iter0
收藏Hugging Face2025-11-03 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/jihuny/tldr_1.4b_10k_gopt_policy_unnorm_penul_prev_1e6_iter0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了提示文本(prompt)、索引(prompt_idx)、选择的文本(chosen)、被拒绝的文本(rejected)、分数(score)、对数概率(logprob)、完成原因(finish_reason)、嵌入向量差(embedding_difference)等字段。数据集分为训练集(train),共有10000个示例。
The dataset includes fields such as prompt, prompt_idx, chosen, rejected, score, logprob, finish_reason, embedding_difference, etc. The dataset is split into a training set (train) with a total of 10,000 examples.
提供机构:
jihuny



