YYYYYYibo/ultrafeedback_binarized_imp_sam_minpi_2_part_2
收藏Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_imp_sam_minpi_2_part_2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于对话或文本生成任务,包含输入提示(prompt)、选择的响应(chosen)、拒绝的响应(rejected)、消息列表(messages)等字段。数据集还包含多个评分和对数概率字段,可能用于模型训练或评估。训练集部分包含19100个样本。
This dataset is primarily used for dialogue or text generation tasks, containing fields such as input prompts (prompt), chosen responses (chosen), rejected responses (rejected), and message lists (messages). The dataset also includes multiple scoring and log probability fields, likely used for model training or evaluation. The training set portion contains 19,100 samples.
提供机构:
YYYYYYibo
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- chosen: 列表类型
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型
- content: 字符串类型
- role: 字符串类型
- messages: 列表类型
- content: 字符串类型
- role: 字符串类型
- score_chosen: 浮点数类型 (float64)
- score_rejected: 浮点数类型 (float64)
- reference_response: 字符串类型
- resp0: 字符串类型
- resp1: 字符串类型
- resp2: 字符串类型
- resp3: 字符串类型
- logpi0: 浮点数类型 (float32)
- logpi1: 浮点数类型 (float32)
- logpi2: 浮点数类型 (float32)
- logpi3: 浮点数类型 (float32)
- logpiref0: 浮点数类型 (float32)
- logpiref1: 浮点数类型 (float32)
- logpiref2: 浮点数类型 (float32)
- logpiref3: 浮点数类型 (float32)
数据分割
- train_prefs:
- num_bytes: 286782477
- num_examples: 19100
数据集大小
- download_size: 155780214
- dataset_size: 286782477
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*
- data_files:



