wanyu/IteraTeR_human_doc

Name: wanyu/IteraTeR_human_doc
Creator: wanyu
Published: 2022-10-24 18:58:15
License: 暂无描述

Hugging Face2022-10-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/wanyu/IteraTeR_human_doc

下载链接

链接失效反馈

官方服务：

资源简介：

IteraTeR-human-doc数据集是一个用于文本到文本生成的英文数据集，特别关注条件文本生成和文本编辑任务。该数据集由众包注释创建，语言为英语（en-US），并且是单语言的。数据集的源数据是原创的，许可证为Apache-2.0。该数据集旨在支持对迭代修订过程的研究，特别是从人类编写的文本中理解迭代修订。

注释创建者： - 众包（crowdsourced）语言数据创建方式： - 现有采集（found）语言： - 英语（en）许可证： - Apache-2.0 多语言特性： - 单语言（monolingual）源数据集： - 原始数据集（original）任务类别： - 文本到文本生成（text2text-generation）任务子项： - 无规范命名：IteraTeR-human-doc 语言BCP 47标签： - en-US（美式英语）标签： - 条件文本生成（conditional-text-generation） - 文本编辑（text-editing）论文：《基于人工撰写文本的迭代修订理解》[https://arxiv.org/abs/2203.03802] 作者：Wanyu Du、Vipul Raheja、Dhruv Kumar、Zae Myung Kim、Melissa Lopez、Dongyeop Kang GitHub仓库：https://github.com/vipulraheja/IteraTeR

提供机构：

wanyu

原始信息汇总

数据集概述

基本信息

名称: IteraTeR-human-doc
语言: 英语 (en)
多语言性: 单语种
来源: 原始数据集
许可证: Apache-2.0

创建者信息

标注创建者: 众包
语言创建者: 发现

任务相关

任务类别: 文本到文本生成
任务ID: 无
标签:
- 条件文本生成
- 文本编辑

语言规范

BCP47语言标签: en-US

5,000+

优质数据集

54 个

任务类型

进入经典数据集