five

plaguss/prm_800k_trl

收藏
Hugging Face2024-12-13 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/plaguss/prm_800k_trl
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是tasksource/PRM800K的一个版本,用于使用TRL微调PRM模型。数据集中每个prompt对应原始数据集中的一行,包含了多个completions和labels。completions是从步骤列表中提取的文本,labels表示每个completion的正确性。数据集未进行去重处理。

This dataset is a version of tasksource/PRM800K prepared to fine tune a PRM model using TRL. Each prompt corresponds to a row in the original dataset, containing multiple completions and labels. The completions are extracted from the list of steps, and the labels indicate the correctness of each completion. The dataset has not been deduplicated.
提供机构:
plaguss
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作