preference-agents-experiments/enron-standardized-jeff-dasovich-20-split
收藏Hugging Face2024-06-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents-experiments/enron-standardized-jeff-dasovich-20-split
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: metadata
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: small_model_baseline
dtype: string
- name: large_model_baseline
dtype: string
- name: large_model_with_70b_rules
dtype: string
- name: large_model_with_8b_rules
dtype: string
- name: large_model_with_nobaseline_rules
dtype: string
- name: no_baseline_rules
dtype: string
- name: with_70b_baseline_rules
dtype: string
- name: with_8b_baseline_rules
dtype: string
- name: naiveft_baseline
dtype: string
- name: naiveft_baseline_oneepc
dtype: string
- name: learned_rulegen_70b_rules
dtype: string
- name: few_shot_baseline
dtype: string
- name: large_model_with_generated_70b_rules
dtype: string
splits:
- name: train
num_bytes: 8696631
num_examples: 797
- name: test
num_bytes: 2191370
num_examples: 200
download_size: 5464153
dataset_size: 10888001
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
The dataset includes multiple features such as id, metadata, input, output, etc., with each feature being of string data type. The dataset is divided into a training set and a test set, containing 797 and 200 samples respectively. The download size of the dataset is 5464153 bytes, and the total size is 10888001 bytes. The dataset configuration is set to default, with the training and test data files stored in data/train-* and data/test-* paths respectively.
提供机构:
preference-agents-experiments
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
- id: 数据类型为字符串。
- metadata: 数据类型为字符串。
- input: 数据类型为字符串。
- output: 数据类型为字符串。
- small_model_baseline: 数据类型为字符串。
- large_model_baseline: 数据类型为字符串。
- large_model_with_70b_rules: 数据类型为字符串。
- large_model_with_8b_rules: 数据类型为字符串。
- large_model_with_nobaseline_rules: 数据类型为字符串。
- no_baseline_rules: 数据类型为字符串。
- with_70b_baseline_rules: 数据类型为字符串。
- with_8b_baseline_rules: 数据类型为字符串。
- naiveft_baseline: 数据类型为字符串。
- naiveft_baseline_oneepc: 数据类型为字符串。
- learned_rulegen_70b_rules: 数据类型为字符串。
- few_shot_baseline: 数据类型为字符串。
- large_model_with_generated_70b_rules: 数据类型为字符串。
数据分割
数据集分为以下几个部分:
- train: 包含797个样本,总字节数为8696631。
- test: 包含200个样本,总字节数为2191370。
数据集大小
- 下载大小: 5464153字节。
- 数据集大小: 10888001字节。
配置信息
- default配置包含以下数据文件:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为



