coval-world-prefs
收藏Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/sumuks/coval-world-prefs
下载链接
链接失效反馈官方服务:
资源简介:
Coval World Prefs 数据集源自 'openai/coval',仅使用标注者的 'world' 排名数据。对于每个提示,该数据集将所有可用的 'world' 排名字符串聚合为每个响应标签的平均排名,然后生成成对的 DPO 风格偏好数据,其中平均排名较低的响应被标记为 'chosen'。数据集包含 5762 个训练样本和 637 个测试样本,总计 6399 个样本。每个样本包含以下关键字段:'prompt'(提示上下文)、'chosen'(优选响应文本)、'rejected'(次选响应文本)、'difficulty'(难度评分)、'rank_margin'(排名差异)、'chosen_mean_rank'/'rejected_mean_rank'(平均排名)以及 'num_world_assessments'(用于该提示的 'world' 评估数量)。数据集的构建仅使用 'world' 排名块,排名字符串被转换为数值排名并进行平均处理,同时在提示级别进行训练/测试分割以避免数据泄漏。
创建时间:
2026-03-24



