five

amueller/syntactic_transformations

收藏
Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/amueller/syntactic_transformations
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于句法转换的英语和德语数据,主要用于疑问句形成和被动语态转换任务。数据集结构包括源序列、目标序列和任务前缀,数据被分为训练集、开发集、测试集和泛化集。此外,数据集还包含零样本跨语言迁移训练和评估数据。
提供机构:
amueller
原始信息汇总

数据集概述

数据集描述

数据集总结

  • 包含用于研究的英语和德语问题形成和被动化转换的数据集。
  • 数据集用于零样本跨语言迁移训练和评估。

支持的任务

  • 数据集支持的任务包括语法转换,如问题形成和被动化。

语言

  • 数据集包含英语和德语两种语言。

数据集结构

数据实例

  • 每个数据点包含源序列(src)、目标序列(tgt)和任务前缀(prefix)。
  • 前缀指示是否应将源序列转换为目标序列,转换类型包括问题形成和被动化。

数据字段

  • src: 原始源序列。
  • tgt: 转换后的目标序列。
  • prefix: 指示应执行的转换类型。

数据分割

  • 数据集分为训练、开发、测试和泛化(generalization)集。
  • 泛化集进一步分为域内和域外语法结构,用于评估模型的归纳偏差。

数据集创建

源数据

  • 数据集为原始数据,未提供具体的收集和标准化信息。

许可证

  • 数据集使用MIT许可证。

多语言性

  • 数据集支持两种语言。

大小类别

  • 数据集大小介于10万到100万之间。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作