preference-agents-experiments/sally-beck-20-split
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents-experiments/sally-beck-20-split
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如发件人、收件人、日期、主题、前文内容、电子邮件内容、用户意图、基线生成、生成规则、黄金规则电子邮件以及多个不同排名的基线生成结果。数据集分为训练集和测试集,训练集包含788个样本,测试集包含197个样本。数据集的下载大小为3336691字节,总大小为6459794字节。
The dataset includes multiple fields related to emails, such as from, to, date, subject, previous_context, email, user_intent, baseline_generation, generated_rules, gold_rule_email, etc., all of which are string types. The dataset is divided into a training set and a test set, containing 788 and 197 samples respectively. The download size of the dataset is 3336691 bytes, and the total size is 6459794 bytes.
提供机构:
preference-agents-experiments
原始信息汇总
数据集概述
数据集特征
- from: 数据类型为字符串
- to: 数据类型为字符串
- date: 数据类型为字符串
- subject: 数据类型为字符串
- previous_context: 数据类型为字符串
- email: 数据类型为字符串
- user_intent: 数据类型为字符串
- baseline_generation: 数据类型为字符串
- generated_rules: 数据类型为字符串
- gold_rule_email: 数据类型为字符串
- naiveft_baseline-64-rank: 数据类型为字符串
- naiveft_baseline-128-rank: 数据类型为字符串
- naiveft_baseline-32-rank: 数据类型为字符串
- naiveft_baseline-16-rank: 数据类型为字符串
- naiveft_baseline-8-rank: 数据类型为字符串
数据集分割
- train: 包含788个示例,总大小为5074403字节
- test: 包含197个示例,总大小为1385391字节
数据集大小
- 下载大小: 3336691字节
- 数据集总大小: 6459794字节
数据文件配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为



