amueller/syntactic_transformations
收藏Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/amueller/syntactic_transformations
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于句法转换的英语和德语数据,主要用于疑问句形成和被动语态转换任务。数据集结构包括源序列、目标序列和任务前缀,数据被分为训练集、开发集、测试集和泛化集。此外,数据集还包含零样本跨语言迁移训练和评估数据。
提供机构:
amueller
原始信息汇总
数据集概述
数据集描述
数据集总结
- 包含用于研究的英语和德语问题形成和被动化转换的数据集。
- 数据集用于零样本跨语言迁移训练和评估。
支持的任务
- 数据集支持的任务包括语法转换,如问题形成和被动化。
语言
- 数据集包含英语和德语两种语言。
数据集结构
数据实例
- 每个数据点包含源序列(src)、目标序列(tgt)和任务前缀(prefix)。
- 前缀指示是否应将源序列转换为目标序列,转换类型包括问题形成和被动化。
数据字段
- src: 原始源序列。
- tgt: 转换后的目标序列。
- prefix: 指示应执行的转换类型。
数据分割
- 数据集分为训练、开发、测试和泛化(generalization)集。
- 泛化集进一步分为域内和域外语法结构,用于评估模型的归纳偏差。
数据集创建
源数据
- 数据集为原始数据,未提供具体的收集和标准化信息。
许可证
- 数据集使用MIT许可证。
多语言性
- 数据集支持两种语言。
大小类别
- 数据集大小介于10万到100万之间。



