preference-agents-working/preference-enron-bckp
收藏Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents-working/preference-enron-bckp
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: from
dtype: string
- name: to
dtype: string
- name: date
dtype: string
- name: subject
dtype: string
- name: previous_context
dtype: string
- name: content
dtype: string
- name: generated_intent_Meta-Llama-3-8B-Instruct
dtype: string
- name: generated_intent_Meta-Llama-3-70B-Instruct
dtype: string
- name: cleaned_intent_Meta-Llama-3-70B-Instruct
dtype: string
- name: cleaned_intent_Meta-Llama-3-8B-Instruct
dtype: string
- name: generated_baseline_Meta-Llama-3-70B-Instruct
dtype: string
- name: cleaned_baseline_Meta-Llama-3-70B-Instruct
dtype: string
- name: generated_rules_Meta-Llama-3-70B-Instruct
dtype: string
- name: cleaned_rules_Meta-Llama-3-70B-Instruct
dtype: string
splits:
- name: train
num_bytes: 290265983
num_examples: 41927
download_size: 120130085
dataset_size: 290265983
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 发件人(from):数据类型为字符串
- 收件人(to):数据类型为字符串
- 日期(date):数据类型为字符串
- 主题(subject):数据类型为字符串
- 上文语境(previous_context):数据类型为字符串
- 内容(content):数据类型为字符串
- 由Meta-Llama-3-8B-Instruct生成的意图(generated_intent_Meta-Llama-3-8B-Instruct):数据类型为字符串
- 由Meta-Llama-3-70B-Instruct生成的意图(generated_intent_Meta-Llama-3-70B-Instruct):数据类型为字符串
- 经Meta-Llama-3-70B-Instruct清洗后的意图(cleaned_intent_Meta-Llama-3-70B-Instruct):数据类型为字符串
- 经Meta-Llama-3-8B-Instruct清洗后的意图(cleaned_intent_Meta-Llama-3-8B-Instruct):数据类型为字符串
- 由Meta-Llama-3-70B-Instruct生成的基线结果(generated_baseline_Meta-Llama-3-70B-Instruct):数据类型为字符串
- 经Meta-Llama-3-70B-Instruct清洗后的基线结果(cleaned_baseline_Meta-Llama-3-70B-Instruct):数据类型为字符串
- 由Meta-Llama-3-70B-Instruct生成的规则结果(generated_rules_Meta-Llama-3-70B-Instruct):数据类型为字符串
- 经Meta-Llama-3-70B-Instruct清洗后的规则结果(cleaned_rules_Meta-Llama-3-70B-Instruct):数据类型为字符串
数据划分:
- 训练集(train):字节数为290265983,样本数量为41927
下载大小:120130085
数据集总大小:290265983
配置项:
- 默认配置(default):数据文件:
- 数据划分:训练集,路径:data/train-*
提供机构:
preference-agents-working
原始信息汇总
数据集概述
数据集特征
- from: 数据类型为字符串
- to: 数据类型为字符串
- date: 数据类型为字符串
- subject: 数据类型为字符串
- previous_context: 数据类型为字符串
- content: 数据类型为字符串
- generated_intent_Meta-Llama-3-8B-Instruct: 数据类型为字符串
- generated_intent_Meta-Llama-3-70B-Instruct: 数据类型为字符串
- cleaned_intent_Meta-Llama-3-70B-Instruct: 数据类型为字符串
- cleaned_intent_Meta-Llama-3-8B-Instruct: 数据类型为字符串
- generated_baseline_Meta-Llama-3-70B-Instruct: 数据类型为字符串
- cleaned_baseline_Meta-Llama-3-70B-Instruct: 数据类型为字符串
- generated_rules_Meta-Llama-3-70B-Instruct: 数据类型为字符串
- cleaned_rules_Meta-Llama-3-70B-Instruct: 数据类型为字符串
数据集分割
- train: 包含41927个样本,数据大小为290265983字节
数据集大小
- 下载大小: 120130085字节
- 数据集大小: 290265983字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



