MoeReward/combined_preference_dataset_qwen2.5_sft_alpaca_heavy

Name: MoeReward/combined_preference_dataset_qwen2.5_sft_alpaca_heavy
Creator: MoeReward
Published: 2025-03-27 01:44:57
License: 暂无描述

Hugging Face2025-03-27 更新2025-04-19 收录

下载链接：

https://hf-mirror.com/datasets/MoeReward/combined_preference_dataset_qwen2.5_sft_alpaca_heavy

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含两个部分：选中(chosen)和拒绝(rejected)，每个部分都包含内容和角色两个字段。数据集仅包含一个训练集，共有10000个示例。

The dataset includes two parts: chosen and rejected, each containing content and role fields. The dataset consists of only one training set with a total of 10,000 examples.

提供机构：

MoeReward

5,000+

优质数据集

54 个

任务类型

进入经典数据集