YYYYYYibo/ultrafeedback_binarized_gshf_lora_vllm_2_part_2

Name: YYYYYYibo/ultrafeedback_binarized_gshf_lora_vllm_2_part_2
Creator: YYYYYYibo
Published: 2024-07-13 11:59:43
License: 暂无描述

Hugging Face2024-07-13 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_gshf_lora_vllm_2_part_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含20000个样本，主要用于训练偏好模型。每个样本包含多个特征字段，如prompt（提示）、prompt_id（提示ID）、chosen（选择的响应）、rejected（拒绝的响应）、messages（消息列表）、score_chosen（选择响应的分数）、score_rejected（拒绝响应的分数）、reference_response（参考响应）以及两个备选响应（resp0和resp1）。数据集的大小为221592878字节，下载大小为120879747字节。

This dataset contains 20,000 samples and is primarily used for training preference models. Each sample includes multiple feature fields such as prompt, prompt_id, chosen (selected response), rejected (rejected response), messages (list of messages), score_chosen (score for the chosen response), score_rejected (score for the rejected response), reference_response, and two alternative responses (resp0 and resp1). The dataset size is 221,592,878 bytes, and the download size is 120,879,747 bytes.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- rejected: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- messages: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- resp0: 字符串类型
- resp1: 字符串类型
分割:
- train_prefs:
  - 字节数: 221,592,878
  - 样本数: 20,000
下载大小: 120,879,747 字节
数据集大小: 221,592,878 字节

配置

配置名称: default
- 数据文件:
  - split: train_prefs
  - path: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集