mlabonne/arena-preferences
收藏Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mlabonne/arena-preferences
下载链接
链接失效反馈官方服务:
资源简介:
Arena Preferences是一个基于lmsys/chatbot_arena_conversations的偏好数据集。它包含多轮对话(最多11轮)和原始样本,这些样本涉及39种不同的语言(未翻译)。数据集中的Chosen answers是GPT-4获胜的答案,并且去除了重复样本和GPTisms样本。数据集还提供了四种最常出现的语言和对话轮数的分布图表。
Arena Preferences是一个基于lmsys/chatbot_arena_conversations的偏好数据集。它包含多轮对话(最多11轮)和原始样本,这些样本涉及39种不同的语言(未翻译)。数据集中的Chosen answers是GPT-4获胜的答案,并且去除了重复样本和GPTisms样本。数据集还提供了四种最常出现的语言和对话轮数的分布图表。
提供机构:
mlabonne
原始信息汇总
数据集概述
基本信息
- 名称: Arena Preferences
- 语言: 英语
- 许可证: Apache-2.0
- 大小分类: 1K<n<10K
数据集结构
特征
- prompt: 字符串类型
- chosen:
- content: 字符串类型
- role: 字符串类型
- rejected:
- content: 字符串类型
- role: 字符串类型
分割
- train:
- 样本数量: 2689
- 数据大小: 7316421.155160391字节
数据集大小
- 下载大小: 4001790字节
- 数据集总大小: 7316421.155160391字节
配置
- 默认配置:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



