jihuny/tldr_1.4b_10k_gopt_policy_norm_penul_mean_1e6_iter0
收藏Hugging Face2025-11-03 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/jihuny/tldr_1.4b_10k_gopt_policy_norm_penul_mean_1e6_iter0
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含文本选择任务相关字段的数据集,其中包括提示文本、选择的文本和拒绝的文本,以及它们各自的索引、分数、对数概率和完成原因。此外,还包括了选择的文本和拒绝的文本的嵌入向量之间的差异。数据集包含一个训练集。
This dataset includes fields related to a text selection task, such as prompt text, chosen text, and rejected text, along with their respective indices, scores, log probabilities, and finish reasons. Additionally, it includes the embedding vector differences between the chosen and rejected texts. The dataset contains a training split.
提供机构:
jihuny



