five

cmoyacal/hotel-aug-noninformative-noisy-a0p90-seed7

收藏
Hugging Face2026-03-30 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/cmoyacal/hotel-aug-noninformative-noisy-a0p90-seed7
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: prompt dtype: string - name: chosen dtype: string - name: rejected dtype: string - name: metadata struct: - name: correlation_mode dtype: string - name: is_tie dtype: bool - name: label_matches_utility dtype: bool - name: margin dtype: float64 - name: option_one_utility dtype: float64 - name: option_two_utility dtype: float64 - name: spurious_decorrelation struct: - name: correlation_mode dtype: string - name: noise_scale dtype: float64 - name: spurious_assignment dtype: string - name: strategy dtype: string - name: spurious_tracking struct: - name: both_correlated dtype: bool - name: hotel_a struct: - name: assignment_type dtype: string - name: correlation_applied dtype: bool - name: correlation_direction dtype: string - name: correlation_mode dtype: string - name: random_roll dtype: float64 - name: threshold dtype: float64 - name: utility dtype: float64 - name: was_high_utility dtype: bool - name: hotel_b struct: - name: assignment_type dtype: string - name: correlation_applied dtype: bool - name: correlation_direction dtype: string - name: correlation_mode dtype: string - name: random_roll dtype: float64 - name: threshold dtype: float64 - name: utility dtype: float64 - name: was_high_utility dtype: bool - name: mixed_correlation dtype: bool - name: neither_correlated dtype: bool - name: tie_threshold dtype: float64 - name: true_better dtype: string - name: true_label dtype: string splits: - name: train num_bytes: 17281234 num_examples: 10999 download_size: 2808211 dataset_size: 17281234 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息(dataset_info): 特征(features): - 字段名:提示(prompt) 数据类型:字符串 - 字段名:优选响应(chosen) 数据类型:字符串 - 字段名:弃选响应(rejected) 数据类型:字符串 - 字段名:元数据(metadata) 数据类型:结构体,包含子字段: - 字段名:相关模式(correlation_mode) 数据类型:字符串 - 字段名:平局标识(is_tie) 数据类型:布尔值 - 字段名:标签与效用匹配性(label_matches_utility) 数据类型:布尔值 - 字段名:边际值(margin) 数据类型:双精度浮点数 - 字段名:选项一效用值(option_one_utility) 数据类型:双精度浮点数 - 字段名:选项二效用值(option_two_utility) 数据类型:双精度浮点数 - 字段名:虚假去相关(spurious_decorrelation) 数据类型:结构体,包含子字段: - 字段名:相关模式(correlation_mode) 数据类型:字符串 - 字段名:噪声尺度(noise_scale) 数据类型:双精度浮点数 - 字段名:虚假分配(spurious_assignment) 数据类型:字符串 - 字段名:策略(strategy) 数据类型:字符串 - 字段名:虚假追踪(spurious_tracking) 数据类型:结构体,包含子字段: - 字段名:双相关标识(both_correlated) 数据类型:布尔值 - 字段名:酒店A(hotel_a) 数据类型:结构体,包含子字段: - 字段名:分配类型(assignment_type) 数据类型:字符串 - 字段名:已应用相关性(correlation_applied) 数据类型:布尔值 - 字段名:相关方向(correlation_direction) 数据类型:字符串 - 字段名:相关模式(correlation_mode) 数据类型:字符串 - 字段名:随机滚动值(random_roll) 数据类型:双精度浮点数 - 字段名:阈值(threshold) 数据类型:双精度浮点数 - 字段名:效用值(utility) 数据类型:双精度浮点数 - 字段名:高效用标识(was_high_utility) 数据类型:布尔值 - 字段名:酒店B(hotel_b) 数据类型:结构体,包含子字段: - 字段名:分配类型(assignment_type) 数据类型:字符串 - 字段名:已应用相关性(correlation_applied) 数据类型:布尔值 - 字段名:相关方向(correlation_direction) 数据类型:字符串 - 字段名:相关模式(correlation_mode) 数据类型:字符串 - 字段名:随机滚动值(random_roll) 数据类型:双精度浮点数 - 字段名:阈值(threshold) 数据类型:双精度浮点数 - 字段名:效用值(utility) 数据类型:双精度浮点数 - 字段名:高效用标识(was_high_utility) 数据类型:布尔值 - 字段名:混合相关标识(mixed_correlation) 数据类型:布尔值 - 字段名:无相关标识(neither_correlated) 数据类型:布尔值 - 字段名:平局阈值(tie_threshold) 数据类型:双精度浮点数 - 字段名:真实更优项(true_better) 数据类型:字符串 - 字段名:真实标签(true_label) 数据类型:字符串 划分集(splits): - 划分名称:训练集(train) 字节数:17281234 样本数:10999 下载大小:2808211 数据集大小:17281234 配置项(configs): - 配置名称:默认配置(default) 数据文件: - 对应划分:训练集(train) 路径:data/train-*
提供机构:
cmoyacal
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作