mytestdpo/llama3_sft_gsm8k_sft_model_gen1_auggsm8k_

Name: mytestdpo/llama3_sft_gsm8k_sft_model_gen1_auggsm8k_
Creator: mytestdpo
Published: 2025-01-19 12:36:07
License: 暂无描述

Hugging Face2025-01-19 更新2025-04-26 收录

下载链接：

https://hf-mirror.com/datasets/mytestdpo/llama3_sft_gsm8k_sft_model_gen1_auggsm8k_

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了一个索引（idx），提示文本（prompt），答案序列（answers），正确答案（gt）以及一个布尔值表示的首个奖励（first_rewards）。它被设计用于训练机器学习模型，特别是那些涉及文本生成和回答问题的模型。数据集分为训练集，共有7496个示例，适合用于模型的训练阶段。

The dataset includes an index (idx), prompt text (prompt), answer sequence (answers), ground truth (gt), and a boolean indicating the first reward (first_rewards). It is designed for training machine learning models, particularly those involving text generation and question answering. The dataset is split into a training set with a total of 7496 examples, suitable for the training phase of models.

提供机构：

mytestdpo

5,000+

优质数据集

54 个

任务类型

进入经典数据集