YYYYYYibo/ultrafeedback_binarized_gshf_lora_train_part_3

Name: YYYYYYibo/ultrafeedback_binarized_gshf_lora_train_part_3
Creator: YYYYYYibo
Published: 2024-07-13 16:40:44
License: 暂无描述

Hugging Face2024-07-13 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_gshf_lora_train_part_3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含对话生成任务的相关数据，主要特征包括prompt（提示）、prompt_id（提示ID）、messages（消息列表，包含内容和角色）、score_chosen（选择得分）、score_rejected（拒绝得分）、reference_response（参考响应）、chosen（选择的消息列表）和rejected（拒绝的消息列表）。数据集包含一个训练分割（train_prefs），包含21,135个示例，总大小为177,243,077字节。该数据集可能用于训练和评估对话生成模型，特别是基于偏好反馈的模型。

This dataset contains data related to dialogue generation tasks, with key features including prompt, prompt_id, messages (containing content and role), score_chosen, score_rejected, reference_response, chosen (list of chosen messages), and rejected (list of rejected messages). The dataset includes a training split (train_prefs) with 21,135 examples and a total size of 177,243,077 bytes. This dataset is likely used for training and evaluating dialogue generation models, particularly those based on preference feedback.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征

prompt: 类型为字符串。
prompt_id: 类型为字符串。
messages: 列表类型，包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。
score_chosen: 类型为浮点数。
score_rejected: 类型为浮点数。
reference_response: 类型为字符串。
chosen: 列表类型，包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。
rejected: 列表类型，包含以下子特征：
- content: 类型为字符串。
- role: 类型为字符串。

数据分割

train_prefs: 包含21135个样本，总字节数为177243077。

数据集大小

下载大小: 96089162字节。
数据集大小: 177243077字节。

配置

default: 包含一个数据文件，路径为data/train_prefs-*。

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是ultrafeedback_binarized_gshf_lora_train_part_3，包含21,135行文本数据，以Parquet格式存储，适用于表格和文本模态。数据集中包含用户提示、模型响应（分为被选择和被拒绝的响应）以及评分，主要用于AI模型训练，特别是通过偏好学习和人类反馈来优化模型性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集