argilla/ultrafeedback-multi-binarized-preferences-cleaned

Name: argilla/ultrafeedback-multi-binarized-preferences-cleaned
Creator: argilla
Published: 2023-12-11 14:21:14
License: 暂无描述

Hugging Face2023-12-11 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/argilla/ultrafeedback-multi-binarized-preferences-cleaned

下载链接

链接失效反馈

官方服务：

资源简介：

UltraFeedback Multi-Binarized Preferences Cleaned数据集是一个用于探索通过使用多个拒绝响应来改进DPO微调效果的数据集。该数据集在AlpacaEval、MT-Bench和LM Eval Harness基准测试中进行了优化。数据集清理了与TruthfulQA和ShareGPT相关的污染数据，并采用了多二值化方法，每个选择的响应都有其对应的多个拒绝响应。

提供机构：

argilla

原始信息汇总

UltraFeedback - Multi-Binarized using the Average of Preference Ratings (Cleaned)

数据集概述

语言: 英语
许可证: MIT
数据集大小: 100K<n<1M
任务类别: 文本生成
数据集名称: UltraFeedback Multi-Binarized Preferences Cleaned

数据集信息

特征:
- source: 字符串类型
- prompt: 字符串类型
- chosen: 列表类型
  - content: 字符串类型
  - role: 字符串类型
- chosen-rating: 浮点数类型
- chosen-model: 字符串类型
- rejected: 列表类型
  - content: 字符串类型
  - role: 字符串类型
- rejected-rating: 浮点数类型
- rejected-model: 字符串类型
分割:
- train: 738122612字节, 157675个样本
下载大小: 196872615字节
数据集大小: 738122612字节

配置

配置名称: default
- 数据文件:
  - split: train
  - path: data/train-*

argilla/ultrafeedback-multi-binarized-preferences-cleaned

UltraFeedback - Multi-Binarized using the Average of Preference Ratings (Cleaned)

数据集概述

数据集信息

配置

标签