five

postbot/aeslc_kw

收藏
Hugging Face2022-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/postbot/aeslc_kw
下载链接
链接失效反馈
官方服务:
资源简介:
AESLC - Cleaned & Keyword Extracted是一个经过清理和关键词提取的AESLC数据集,专门用于文本到文本生成,特别是电子邮件生成。数据集包含电子邮件正文、主题行、清理后的电子邮件和提取的关键词,适用于英语单语种,遵循MIT许可证。
提供机构:
postbot
原始信息汇总

数据集概述

基本信息

  • 名称: AESLC - Cleaned & Keyword Extracted
  • 语言: 英语 (en)
  • 许可证: MIT
  • 多语言性: 单语种
  • 来源数据集: aeslc
  • 标签:
    • 文本到文本生成
    • 电子邮件
    • 电子邮件生成
    • Enron

数据集描述

  • 该数据集是对原始aeslc数据集的清理和关键词提取版本。
  • 关键词被提取到新的列中。

数据结构

  • 训练集: 包含14436条记录,具有以下特征:
    • email_body
    • subject_line
    • clean_email
    • clean_email_keywords
  • 测试集: 包含1906条记录,具有相同特征。
  • 验证集: 包含1960条记录,具有相同特征。

引用信息

  • 论文: This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation
  • 作者: Rui Zhang and Joel Tetreault
  • 会议: Proceedings of The 57th Annual Meeting of the Association for Computational Linguistics
  • 年份: 2019
  • 地点: Florence, Italy
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作