five

preference-agents-experiments/sally-beck-20-split

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents-experiments/sally-beck-20-split
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,如发件人、收件人、日期、主题、前文内容、电子邮件内容、用户意图、基线生成、生成规则、黄金规则电子邮件以及多个不同排名的基线生成结果。数据集分为训练集和测试集,训练集包含788个样本,测试集包含197个样本。数据集的下载大小为3336691字节,总大小为6459794字节。

The dataset includes multiple fields related to emails, such as from, to, date, subject, previous_context, email, user_intent, baseline_generation, generated_rules, gold_rule_email, etc., all of which are string types. The dataset is divided into a training set and a test set, containing 788 and 197 samples respectively. The download size of the dataset is 3336691 bytes, and the total size is 6459794 bytes.
提供机构:
preference-agents-experiments
原始信息汇总

数据集概述

数据集特征

  • from: 数据类型为字符串
  • to: 数据类型为字符串
  • date: 数据类型为字符串
  • subject: 数据类型为字符串
  • previous_context: 数据类型为字符串
  • email: 数据类型为字符串
  • user_intent: 数据类型为字符串
  • baseline_generation: 数据类型为字符串
  • generated_rules: 数据类型为字符串
  • gold_rule_email: 数据类型为字符串
  • naiveft_baseline-64-rank: 数据类型为字符串
  • naiveft_baseline-128-rank: 数据类型为字符串
  • naiveft_baseline-32-rank: 数据类型为字符串
  • naiveft_baseline-16-rank: 数据类型为字符串
  • naiveft_baseline-8-rank: 数据类型为字符串

数据集分割

  • train: 包含788个示例,总大小为5074403字节
  • test: 包含197个示例,总大小为1385391字节

数据集大小

  • 下载大小: 3336691字节
  • 数据集总大小: 6459794字节

数据文件配置

  • config_name: default
  • data_files:
    • train: 路径为data/train-*
    • test: 路径为data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作