zhengbang0707/REFUEL-Ultrainteract-Llama-3-Armo-iter_2_TWise_30k

Name: zhengbang0707/REFUEL-Ultrainteract-Llama-3-Armo-iter_2_TWise_30k
Creator: zhengbang0707
Published: 2025-04-09 20:04:36
License: 暂无描述

Hugging Face2025-04-09 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/zhengbang0707/REFUEL-Ultrainteract-Llama-3-Armo-iter_2_TWise_30k

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含文本内容、角色、序列标记、掩码序列和奖励值的数据集，分为训练集和测试集。每个样本包含被选中的文本和被拒绝的文本，以及相应的角色、标记序列、掩码序列和奖励值。

This dataset includes text content, roles, sequence tokens, mask sequences, and reward values, split into training and testing sets. Each sample contains chosen and rejected text, along with corresponding roles, token sequences, mask sequences, and reward values.

提供机构：

zhengbang0707

5,000+

优质数据集

54 个

任务类型

进入经典数据集