five

tasksource/HYPO-L

收藏
Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/HYPO-L
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集与夸张生成任务相关,包含一个名为HYPO-XL的大规模英语夸张语料库,其中包含17,862个夸张句子。该数据集用于将字面句子转换为其夸张的改写版本,支持无监督的夸张生成方法。
提供机构:
tasksource
原始信息汇总

数据集概述

数据集名称

  • MOVER

数据集描述

  • 用于超夸张表达生成(Hyperbole Generation)的数据集。
  • 包含17,862个英语超夸张句子,构成HYPO-XL语料库。

数据集用途

  • 支持无监督超夸张表达生成方法的研究。
  • 通过掩码、过度生成和排序技术,将字面句子转换为超夸张的改写。

数据集特点

  • 首个大规模英语超夸张语料库。
  • 采用BART模型进行训练,结合BERT模型进行候选句子的排序。

数据集评估

  • 自动和人工评估结果显示,该模型在生成超夸张改写句子上表现有效,并优于多个基准系统。

数据集语言

  • 英语(en)

数据集标签

  • 超夸张(hyperbola)
  • 夸张(exageration)

数据集许可证

  • MIT许可证

数据集任务类别

  • 文本分类(text-classification)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作