cmoyacal/hotel-aug-noninformative-noisy-a0p90-seed7
收藏Hugging Face2026-03-30 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/cmoyacal/hotel-aug-noninformative-noisy-a0p90-seed7
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: metadata
struct:
- name: correlation_mode
dtype: string
- name: is_tie
dtype: bool
- name: label_matches_utility
dtype: bool
- name: margin
dtype: float64
- name: option_one_utility
dtype: float64
- name: option_two_utility
dtype: float64
- name: spurious_decorrelation
struct:
- name: correlation_mode
dtype: string
- name: noise_scale
dtype: float64
- name: spurious_assignment
dtype: string
- name: strategy
dtype: string
- name: spurious_tracking
struct:
- name: both_correlated
dtype: bool
- name: hotel_a
struct:
- name: assignment_type
dtype: string
- name: correlation_applied
dtype: bool
- name: correlation_direction
dtype: string
- name: correlation_mode
dtype: string
- name: random_roll
dtype: float64
- name: threshold
dtype: float64
- name: utility
dtype: float64
- name: was_high_utility
dtype: bool
- name: hotel_b
struct:
- name: assignment_type
dtype: string
- name: correlation_applied
dtype: bool
- name: correlation_direction
dtype: string
- name: correlation_mode
dtype: string
- name: random_roll
dtype: float64
- name: threshold
dtype: float64
- name: utility
dtype: float64
- name: was_high_utility
dtype: bool
- name: mixed_correlation
dtype: bool
- name: neither_correlated
dtype: bool
- name: tie_threshold
dtype: float64
- name: true_better
dtype: string
- name: true_label
dtype: string
splits:
- name: train
num_bytes: 17281234
num_examples: 10999
download_size: 2808211
dataset_size: 17281234
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征(features):
- 字段名:提示(prompt)
数据类型:字符串
- 字段名:优选响应(chosen)
数据类型:字符串
- 字段名:弃选响应(rejected)
数据类型:字符串
- 字段名:元数据(metadata)
数据类型:结构体,包含子字段:
- 字段名:相关模式(correlation_mode)
数据类型:字符串
- 字段名:平局标识(is_tie)
数据类型:布尔值
- 字段名:标签与效用匹配性(label_matches_utility)
数据类型:布尔值
- 字段名:边际值(margin)
数据类型:双精度浮点数
- 字段名:选项一效用值(option_one_utility)
数据类型:双精度浮点数
- 字段名:选项二效用值(option_two_utility)
数据类型:双精度浮点数
- 字段名:虚假去相关(spurious_decorrelation)
数据类型:结构体,包含子字段:
- 字段名:相关模式(correlation_mode)
数据类型:字符串
- 字段名:噪声尺度(noise_scale)
数据类型:双精度浮点数
- 字段名:虚假分配(spurious_assignment)
数据类型:字符串
- 字段名:策略(strategy)
数据类型:字符串
- 字段名:虚假追踪(spurious_tracking)
数据类型:结构体,包含子字段:
- 字段名:双相关标识(both_correlated)
数据类型:布尔值
- 字段名:酒店A(hotel_a)
数据类型:结构体,包含子字段:
- 字段名:分配类型(assignment_type)
数据类型:字符串
- 字段名:已应用相关性(correlation_applied)
数据类型:布尔值
- 字段名:相关方向(correlation_direction)
数据类型:字符串
- 字段名:相关模式(correlation_mode)
数据类型:字符串
- 字段名:随机滚动值(random_roll)
数据类型:双精度浮点数
- 字段名:阈值(threshold)
数据类型:双精度浮点数
- 字段名:效用值(utility)
数据类型:双精度浮点数
- 字段名:高效用标识(was_high_utility)
数据类型:布尔值
- 字段名:酒店B(hotel_b)
数据类型:结构体,包含子字段:
- 字段名:分配类型(assignment_type)
数据类型:字符串
- 字段名:已应用相关性(correlation_applied)
数据类型:布尔值
- 字段名:相关方向(correlation_direction)
数据类型:字符串
- 字段名:相关模式(correlation_mode)
数据类型:字符串
- 字段名:随机滚动值(random_roll)
数据类型:双精度浮点数
- 字段名:阈值(threshold)
数据类型:双精度浮点数
- 字段名:效用值(utility)
数据类型:双精度浮点数
- 字段名:高效用标识(was_high_utility)
数据类型:布尔值
- 字段名:混合相关标识(mixed_correlation)
数据类型:布尔值
- 字段名:无相关标识(neither_correlated)
数据类型:布尔值
- 字段名:平局阈值(tie_threshold)
数据类型:双精度浮点数
- 字段名:真实更优项(true_better)
数据类型:字符串
- 字段名:真实标签(true_label)
数据类型:字符串
划分集(splits):
- 划分名称:训练集(train)
字节数:17281234
样本数:10999
下载大小:2808211
数据集大小:17281234
配置项(configs):
- 配置名称:默认配置(default)
数据文件:
- 对应划分:训练集(train)
路径:data/train-*
提供机构:
cmoyacal



