chargoddard/PIPPA-Judged
收藏Hugging Face2023-12-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chargoddard/PIPPA-Judged
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为PIPPA-Judged,是基于Pygmalion的PIPPA数据集,并通过TheBloke/OpenOrca-Platypus2-13B-GPTQ模型生成了质量评分。数据集包含四个配置(adequately_rated、best_rated、default、ratings_only),每个配置的特征包括ID、评分、提交时间戳、类别、机器人ID、机器人名称、机器人问候语、机器人定义、机器人描述以及对话内容。数据集的主要用途是用于模型复现,建议用户参考更高质量的数据集pippa_scored。
提供机构:
chargoddard
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 对话
- 语言: 英语
- 标签:
- 非所有受众
- 对话
- 角色扮演
- 自定义格式
数据集配置
配置 adequately_rated
- 特征:
id: 字符串rating: 结构体analysis: 字符串judge: 字符串score: 浮点数 (float64)
submission_timestamp: 时间戳 (timestamp[ns])categories: 字符串序列bot_id: 字符串bot_name: 字符串bot_greeting: 字符串bot_definitions: 字符串bot_description: 字符串conversation: 结构体is_human: 布尔序列message: 字符串序列
- 分割:
train:- 字节数: 203748289.37737644
- 示例数: 14610
- 下载大小: 111617678
- 数据集大小: 203748289.37737644
配置 best_rated
- 特征:
id: 字符串rating: 结构体analysis: 字符串judge: 字符串score: 浮点数 (float64)
submission_timestamp: 时间戳 (timestamp[ns])categories: 字符串序列bot_id: 字符串bot_name: 字符串bot_greeting: 字符串bot_definitions: 字符串bot_description: 字符串conversation: 结构体is_human: 布尔序列message: 字符串序列
- 分割:
train:- 字节数: 10780111.409220532
- 示例数: 773
- 下载大小: 9421151
- 数据集大小: 10780111.409220532
配置 default
- 特征:
id: 字符串rating: 结构体analysis: 字符串judge: 字符串score: 浮点数 (float64)
submission_timestamp: 时间戳 (timestamp[ns])categories: 字符串序列bot_id: 字符串bot_name: 字符串bot_greeting: 字符串bot_definitions: 字符串bot_description: 字符串conversation: 结构体is_human: 布尔序列message: 字符串序列
- 分割:
train:- 字节数: 234735880
- 示例数: 16832
- 下载大小: 116686573
- 数据集大小: 234735880
配置 ratings_only
- 特征:
success: 布尔值score: 浮点数 (float64)response: 字符串id: 字符串
- 分割:
train:- 字节数: 7190167
- 示例数: 16832
- 下载大小: 2848419
- 数据集大小: 7190167
数据文件路径
- adequately_rated:
train: adequately_rated/train-*
- best_rated:
train: best_rated/train-*
- default:
train: data/train-*
- ratings_only:
train: ratings_only/train-*



