arcagi2/deb-test-rl-dapo-tool-hook
收藏Hugging Face2025-09-19 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/arcagi2/deb-test-rl-dapo-tool-hook
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本数据,其中包括数据源、提示(内容与角色)、能力、奖励模型(地面真实与风格)以及额外信息(索引)。数据集分为训练集,共有1000个示例。
The dataset contains text data, including data source, prompt (content and role), ability, reward model (ground truth and style), and extra information (index). The dataset is split into a training set with a total of 1000 examples.
提供机构:
arcagi2



