five

preference-agents/enron-cleaned

收藏
Hugging Face2024-04-25 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/preference-agents/enron-cleaned
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: message_id dtype: string - name: from dtype: string - name: to dtype: string - name: date dtype: string - name: subject dtype: string - name: content dtype: string - name: email_context dtype: string - name: token_count_content dtype: int32 - name: token_count_context dtype: int32 - name: intent dtype: string - name: baseline struct: - name: google/gemma-1.1-2b-it dtype: string - name: google/gemma-1.1-7b-it dtype: string - name: meta-llama/Meta-Llama-3-70B-Instruct dtype: string - name: meta-llama/Meta-Llama-3-8B-Instruct dtype: string - name: mistralai/Mistral-7B-Instruct-v0.2 dtype: string - name: automatic_eval struct: - name: google/gemma-1.1-2b-it struct: - name: BERT Cosine Similarity dtype: float64 - name: BLEU Score dtype: float64 - name: ROUGE-L Score dtype: float64 - name: TF-IDF Cosine Similarity dtype: float64 - name: google/gemma-1.1-7b-it struct: - name: BERT Cosine Similarity dtype: float64 - name: BLEU Score dtype: float64 - name: ROUGE-L Score dtype: float64 - name: TF-IDF Cosine Similarity dtype: float64 - name: meta-llama/Meta-Llama-3-8B-Instruct struct: - name: BERT Cosine Similarity dtype: float64 - name: BLEU Score dtype: float64 - name: ROUGE-L Score dtype: float64 - name: TF-IDF Cosine Similarity dtype: float64 - name: mistralai/Mistral-7B-Instruct-v0.2 struct: - name: BERT Cosine Similarity dtype: float64 - name: BLEU Score dtype: float64 - name: ROUGE-L Score dtype: float64 - name: TF-IDF Cosine Similarity dtype: float64 splits: - name: train num_bytes: 95526649 num_examples: 20330 download_size: 51947088 dataset_size: 95526649 configs: - config_name: default data_files: - split: train path: data/train-* ---
提供机构:
preference-agents
原始信息汇总

数据集概述

数据集特征

  • message_id: 字符串类型
  • from: 字符串类型
  • to: 字符串类型
  • date: 字符串类型
  • subject: 字符串类型
  • content: 字符串类型
  • email_context: 字符串类型
  • token_count_content: 32位整数类型
  • token_count_context: 32位整数类型
  • intent: 字符串类型
  • baseline: 结构体类型,包含以下字段:
    • google/gemma-1.1-2b-it: 字符串类型
    • google/gemma-1.1-7b-it: 字符串类型
    • meta-llama/Meta-Llama-3-70B-Instruct: 字符串类型
    • meta-llama/Meta-Llama-3-8B-Instruct: 字符串类型
    • mistralai/Mistral-7B-Instruct-v0.2: 字符串类型
  • automatic_eval: 结构体类型,包含以下字段:
    • google/gemma-1.1-2b-it: 结构体类型,包含以下字段:
      • BERT Cosine Similarity: 64位浮点数类型
      • BLEU Score: 64位浮点数类型
      • ROUGE-L Score: 64位浮点数类型
      • TF-IDF Cosine Similarity: 64位浮点数类型
    • google/gemma-1.1-7b-it: 结构体类型,包含以下字段:
      • BERT Cosine Similarity: 64位浮点数类型
      • BLEU Score: 64位浮点数类型
      • ROUGE-L Score: 64位浮点数类型
      • TF-IDF Cosine Similarity: 64位浮点数类型
    • meta-llama/Meta-Llama-3-8B-Instruct: 结构体类型,包含以下字段:
      • BERT Cosine Similarity: 64位浮点数类型
      • BLEU Score: 64位浮点数类型
      • ROUGE-L Score: 64位浮点数类型
      • TF-IDF Cosine Similarity: 64位浮点数类型
    • mistralai/Mistral-7B-Instruct-v0.2: 结构体类型,包含以下字段:
      • BERT Cosine Similarity: 64位浮点数类型
      • BLEU Score: 64位浮点数类型
      • ROUGE-L Score: 64位浮点数类型
      • TF-IDF Cosine Similarity: 64位浮点数类型

数据集分割

  • train:
    • 字节数: 95526649
    • 样本数: 20330

数据集大小

  • 下载大小: 51947088 字节
  • 数据集大小: 95526649 字节

配置

  • default:
    • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作