Preference-Dissection/preference-dissection

Name: Preference-Dissection/preference-dissection
Creator: Preference-Dissection
Published: 2024-02-15 05:17:10
License: 暂无描述

Hugging Face2024-02-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Preference-Dissection/preference-dissection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集基于lmsys/chatbot_arena_conversations，包含了从Chatbot Arena收集的对话数据，并经过过滤和场景分类处理。数据集的主要特征包括用户查询、场景分类、模型生成的响应、GPT-4-Turbo生成的参考响应、用户意图的明确性、情感表达、显式约束、主观立场、错误或偏见等。此外，数据集还包含了人类和多个LLM的偏好标签，以及对响应的基本属性和错误检测的详细注释。

提供机构：

Preference-Dissection

原始信息汇总

数据集概述

数据集信息

特征

query: 用户查询，数据类型为字符串。
scenario_auto-j: 由Auto-J分类器分类的场景，数据类型为字符串。
scenario_group: 从Auto-J场景合并的10个新场景之一，包括一个Unsafe Query场景，数据类型为字符串。
response_1: 第一个响应的内容，包含以下子字段：
- content: 文本内容，数据类型为字符串。
- model: 生成此响应的模型，数据类型为字符串。
- num_words: 此响应的单词数量，数据类型为int64。
response_2: 第二个响应的内容，结构与response_1相同。
gpt-4-turbo_reference: 由GPT-4-Turbo生成的参考响应，数据类型为字符串。
clear intent: 用户意图是否在查询中清晰表达，数据类型为字符串。
explicitly express feelings: 用户是否在查询中明确表达情感，数据类型为字符串。
explicit constraints: 查询中的所有明确约束，数据类型为字符串序列。
explicit subjective stances: 查询中的所有主观立场，数据类型为字符串序列。
explicit mistakes or biases: 查询中的所有错误或偏见，数据类型为字符串序列。
preference_labels: 每个评判者（人类或LLM）的偏好标签，指示在成对响应中哪个更受偏好，包含多个子字段，每个子字段的数据类型为字符串。
basic_response_1: 第一个响应的20个基本属性（除lengthy外）的标注评分，包含多个子字段，每个子字段的数据类型为int64。
basic_response_2: 第二个响应的20个基本属性（除lengthy外）的标注评分，结构与basic_response_1相同。
errors_response_1: 第一个响应的检测错误，包含以下子字段：
- applicable or not: 是否适用，数据类型为字符串。
- errors: 检测到的错误列表，每个错误包含以下子字段：
  - brief description: 错误的简要描述，数据类型为字符串。
  - severity: 错误的影响程度，数据类型为字符串。
  - type: 错误的类型，数据类型为字符串。
errors_response_2: 第二个响应的检测错误，结构与errors_response_1相同。
query-specific_response_1: 第一个响应的查询特定属性的标注结果，包含多个子字段，数据类型为int64或字符串序列。
query-specific_response_2: 第二个响应的查询特定属性的标注结果，结构与query-specific_response_1相同。

数据集分割

train: 训练集，包含5240个样本，总字节数为27617371。

数据集大小

download_size: 13124269字节。
dataset_size: 27617371字节。

配置

default: 默认配置，包含训练集数据文件。

语言

en: 英语。

数据集名称

pretty_name: Preference Dissection。

许可证

license: CC-BY-NC-4.0。

数据集统计

查询特定前提条件样本数

前提条件	样本数	前提条件	样本数
with explicit constraints	1,418	unclear intent	459
show subjective stances	388	express feelings	121
contain mistakes or bias	401

属性平均得分/计数

属性	平均得分/计数	属性	平均得分/计数
平均得分
harmless	2.90	persuasive	0.27
grammarly correct	2.70	step-by-step	0.37
friendly	1.79	use informal expressions	0.04
polite	2.78	clear	2.54
interactive	0.22	contain rich information	1.74
authoritative	1.67	novel	0.47
funny	0.08	relevant	2.45
use rhetorical devices	0.16	clarify intent*	1.33
complex word & sentence	0.89	show empathetic*	1.48
use supporting materials	0.13	satisfy constraints*	2.01
well formatted	1.26	support stances*	2.28
admit limits	0.17	correct mistakes*	1.08
平均计数
severe errors	0.59	minor errors	0.23
moderate errors	0.61	length	164.52

5,000+

优质数据集

54 个

任务类型

进入经典数据集