postbot/aeslc_kw
收藏Hugging Face2022-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/postbot/aeslc_kw
下载链接
链接失效反馈官方服务:
资源简介:
AESLC - Cleaned & Keyword Extracted是一个经过清理和关键词提取的AESLC数据集,专门用于文本到文本生成,特别是电子邮件生成。数据集包含电子邮件正文、主题行、清理后的电子邮件和提取的关键词,适用于英语单语种,遵循MIT许可证。
提供机构:
postbot
原始信息汇总
数据集概述
基本信息
- 名称: AESLC - Cleaned & Keyword Extracted
- 语言: 英语 (en)
- 许可证: MIT
- 多语言性: 单语种
- 来源数据集: aeslc
- 标签:
- 文本到文本生成
- 电子邮件
- 电子邮件生成
- Enron
数据集描述
- 该数据集是对原始aeslc数据集的清理和关键词提取版本。
- 关键词被提取到新的列中。
数据结构
- 训练集: 包含14436条记录,具有以下特征:
- email_body
- subject_line
- clean_email
- clean_email_keywords
- 测试集: 包含1906条记录,具有相同特征。
- 验证集: 包含1960条记录,具有相同特征。
引用信息
- 论文: This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation
- 作者: Rui Zhang and Joel Tetreault
- 会议: Proceedings of The 57th Annual Meeting of the Association for Computational Linguistics
- 年份: 2019
- 地点: Florence, Italy



