five

TEEN-D/grpo-oumi-c2d-d2c-subset

收藏
Hugging Face2025-04-24 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/TEEN-D/grpo-oumi-c2d-d2c-subset
下载链接
链接失效反馈
官方服务:
资源简介:
GRPO Oumi ANLI子集数据集是对oumi-ai/oumi-c2d-d2c-subset数据集的重新格式化版本,专为GRPO训练器设计。数据集由一系列字典组成,每个字典代表一个数据实例,包含prompt和completion字段。prompt字段包括上下文文档和用户请求,completion字段包括模型预期的响应,如主张、子主张、引用标记、解释和支持状态。

This dataset is a reformatted version of the `oumi-ai/oumi-c2d-d2c-subset` dataset, specifically structured for use with the GRPO trainer. The dataset consists of a list of dictionaries, each representing a single data instance with a `prompt` and a `completion` field.
提供机构:
TEEN-D
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作