preference-agents/enron-cleaned
收藏Hugging Face2024-04-25 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents/enron-cleaned
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: message_id
dtype: string
- name: from
dtype: string
- name: to
dtype: string
- name: date
dtype: string
- name: subject
dtype: string
- name: content
dtype: string
- name: email_context
dtype: string
- name: token_count_content
dtype: int32
- name: token_count_context
dtype: int32
- name: intent
dtype: string
- name: baseline
struct:
- name: google/gemma-1.1-2b-it
dtype: string
- name: google/gemma-1.1-7b-it
dtype: string
- name: meta-llama/Meta-Llama-3-70B-Instruct
dtype: string
- name: meta-llama/Meta-Llama-3-8B-Instruct
dtype: string
- name: mistralai/Mistral-7B-Instruct-v0.2
dtype: string
- name: automatic_eval
struct:
- name: google/gemma-1.1-2b-it
struct:
- name: BERT Cosine Similarity
dtype: float64
- name: BLEU Score
dtype: float64
- name: ROUGE-L Score
dtype: float64
- name: TF-IDF Cosine Similarity
dtype: float64
- name: google/gemma-1.1-7b-it
struct:
- name: BERT Cosine Similarity
dtype: float64
- name: BLEU Score
dtype: float64
- name: ROUGE-L Score
dtype: float64
- name: TF-IDF Cosine Similarity
dtype: float64
- name: meta-llama/Meta-Llama-3-8B-Instruct
struct:
- name: BERT Cosine Similarity
dtype: float64
- name: BLEU Score
dtype: float64
- name: ROUGE-L Score
dtype: float64
- name: TF-IDF Cosine Similarity
dtype: float64
- name: mistralai/Mistral-7B-Instruct-v0.2
struct:
- name: BERT Cosine Similarity
dtype: float64
- name: BLEU Score
dtype: float64
- name: ROUGE-L Score
dtype: float64
- name: TF-IDF Cosine Similarity
dtype: float64
splits:
- name: train
num_bytes: 95526649
num_examples: 20330
download_size: 51947088
dataset_size: 95526649
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
preference-agents
原始信息汇总
数据集概述
数据集特征
- message_id: 字符串类型
- from: 字符串类型
- to: 字符串类型
- date: 字符串类型
- subject: 字符串类型
- content: 字符串类型
- email_context: 字符串类型
- token_count_content: 32位整数类型
- token_count_context: 32位整数类型
- intent: 字符串类型
- baseline: 结构体类型,包含以下字段:
- google/gemma-1.1-2b-it: 字符串类型
- google/gemma-1.1-7b-it: 字符串类型
- meta-llama/Meta-Llama-3-70B-Instruct: 字符串类型
- meta-llama/Meta-Llama-3-8B-Instruct: 字符串类型
- mistralai/Mistral-7B-Instruct-v0.2: 字符串类型
- automatic_eval: 结构体类型,包含以下字段:
- google/gemma-1.1-2b-it: 结构体类型,包含以下字段:
- BERT Cosine Similarity: 64位浮点数类型
- BLEU Score: 64位浮点数类型
- ROUGE-L Score: 64位浮点数类型
- TF-IDF Cosine Similarity: 64位浮点数类型
- google/gemma-1.1-7b-it: 结构体类型,包含以下字段:
- BERT Cosine Similarity: 64位浮点数类型
- BLEU Score: 64位浮点数类型
- ROUGE-L Score: 64位浮点数类型
- TF-IDF Cosine Similarity: 64位浮点数类型
- meta-llama/Meta-Llama-3-8B-Instruct: 结构体类型,包含以下字段:
- BERT Cosine Similarity: 64位浮点数类型
- BLEU Score: 64位浮点数类型
- ROUGE-L Score: 64位浮点数类型
- TF-IDF Cosine Similarity: 64位浮点数类型
- mistralai/Mistral-7B-Instruct-v0.2: 结构体类型,包含以下字段:
- BERT Cosine Similarity: 64位浮点数类型
- BLEU Score: 64位浮点数类型
- ROUGE-L Score: 64位浮点数类型
- TF-IDF Cosine Similarity: 64位浮点数类型
- google/gemma-1.1-2b-it: 结构体类型,包含以下字段:
数据集分割
- train:
- 字节数: 95526649
- 样本数: 20330
数据集大小
- 下载大小: 51947088 字节
- 数据集大小: 95526649 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



