tasksource/HYPO-L
收藏Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/HYPO-L
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与夸张生成任务相关,包含一个名为HYPO-XL的大规模英语夸张语料库,其中包含17,862个夸张句子。该数据集用于将字面句子转换为其夸张的改写版本,支持无监督的夸张生成方法。
提供机构:
tasksource
原始信息汇总
数据集概述
数据集名称
- MOVER
数据集描述
- 用于超夸张表达生成(Hyperbole Generation)的数据集。
- 包含17,862个英语超夸张句子,构成HYPO-XL语料库。
数据集用途
- 支持无监督超夸张表达生成方法的研究。
- 通过掩码、过度生成和排序技术,将字面句子转换为超夸张的改写。
数据集特点
- 首个大规模英语超夸张语料库。
- 采用BART模型进行训练,结合BERT模型进行候选句子的排序。
数据集评估
- 自动和人工评估结果显示,该模型在生成超夸张改写句子上表现有效,并优于多个基准系统。
数据集语言
- 英语(en)
数据集标签
- 超夸张(hyperbola)
- 夸张(exageration)
数据集许可证
- MIT许可证
数据集任务类别
- 文本分类(text-classification)



