mytestdpo/llama3_it_8b_gsm8k_kumar_baselinetmp0
收藏Hugging Face2024-12-30 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/mytestdpo/llama3_it_8b_gsm8k_kumar_baselinetmp0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含多个文本字段和标签的文本数据集,适用于机器学习模型训练。数据集包含训练集,具体包括索引、真实标签、提示文本、答案文本、用户解决方案文本、预测文本以及奖励标签。
The dataset is a text dataset containing multiple text fields and labels, suitable for machine learning model training. It includes a training set with index, ground truth labels, prompt text, answer text, user solution text, predicted text, and reward labels.
提供机构:
mytestdpo



