YYYYYYibo/ultrafeedback_binarized_imp_sam_1_vllm_part_3

Name: YYYYYYibo/ultrafeedback_binarized_imp_sam_1_vllm_part_3
Creator: YYYYYYibo
Published: 2024-07-12 18:22:47
License: 暂无描述

Hugging Face2024-07-12 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_imp_sam_1_vllm_part_3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个字段，如prompt、prompt_id、chosen、rejected、messages等，主要用于记录和比较不同响应的选择和评分。数据集的分割为train_prefs，包含19835个例子，主要用于训练和评估模型对不同响应的偏好。

This dataset includes multiple fields such as prompt, prompt_id, chosen, rejected, messages, etc., primarily used to record and compare the selection and scoring of different responses. The dataset is split into train_prefs, containing 19835 examples, mainly used for training and evaluating model preferences for different responses.

提供机构：

YYYYYYibo

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- rejected: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- messages: 列表类型，包含以下字段:
  - content: 字符串类型
  - role: 字符串类型
- score_chosen: 浮点数类型
- score_rejected: 浮点数类型
- reference_response: 字符串类型
- resp0: 字符串类型
- resp1: 字符串类型
- resp2: 字符串类型
- resp3: 字符串类型
分割:
- train_prefs:
  - 字节数: 255,302,589
  - 样本数: 19,835
下载大小: 138,291,914 字节
数据集大小: 255,302,589 字节

配置

配置名称: default
- 数据文件:
  - split: train_prefs
  - path: data/train_prefs-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集