wanyu/IteraTeR_human_doc
收藏Hugging Face2022-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wanyu/IteraTeR_human_doc
下载链接
链接失效反馈官方服务:
资源简介:
IteraTeR-human-doc数据集是一个用于文本到文本生成的英文数据集,特别关注条件文本生成和文本编辑任务。该数据集由众包注释创建,语言为英语(en-US),并且是单语言的。数据集的源数据是原创的,许可证为Apache-2.0。该数据集旨在支持对迭代修订过程的研究,特别是从人类编写的文本中理解迭代修订。
注释创建者:
- 众包(crowdsourced)
语言数据创建方式:
- 现有采集(found)
语言:
- 英语(en)
许可证:
- Apache-2.0
多语言特性:
- 单语言(monolingual)
源数据集:
- 原始数据集(original)
任务类别:
- 文本到文本生成(text2text-generation)
任务子项:
- 无
规范命名:IteraTeR-human-doc
语言BCP 47标签:
- en-US(美式英语)
标签:
- 条件文本生成(conditional-text-generation)
- 文本编辑(text-editing)
论文:《基于人工撰写文本的迭代修订理解》[https://arxiv.org/abs/2203.03802]
作者:Wanyu Du、Vipul Raheja、Dhruv Kumar、Zae Myung Kim、Melissa Lopez、Dongyeop Kang
GitHub仓库:https://github.com/vipulraheja/IteraTeR
提供机构:
wanyu
原始信息汇总
数据集概述
基本信息
- 名称: IteraTeR-human-doc
- 语言: 英语 (en)
- 多语言性: 单语种
- 来源: 原始数据集
- 许可证: Apache-2.0
创建者信息
- 标注创建者: 众包
- 语言创建者: 发现
任务相关
- 任务类别: 文本到文本生成
- 任务ID: 无
- 标签:
- 条件文本生成
- 文本编辑
语言规范
- BCP47语言标签: en-US



