summarize_from_feedback
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/openai/summarize_from_feedback?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
Summarize from Feedback 提供了用于训练奖励模型的由人类反馈组成的数据集,旨在使摘要模型与人类偏好对齐。该数据集包含两部分:`comparisons` 部分通过人工标注比较两个摘要的优劣,`axis` 部分则让人工标注者对摘要质量进行评分。`comparisons` 部分包含训练集和验证集,而 `axis` 部分包含测试集和验证集。该数据集的摘要来源于 TL;DR 数据集、CNN 文章和 Daily Mail 文章。
提供机构:
openai
创建时间:
2024-07-19



