five

ctu-aic/qa2d-sk

收藏
Hugging Face2024-03-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ctu-aic/qa2d-sk
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是斯洛伐克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为15067362字节,总大小为20298930字节。该数据集适用于文本到文本生成任务,许可证为MIT。

该数据集是斯洛伐克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为15067362字节,总大小为20298930字节。该数据集适用于文本到文本生成任务,许可证为MIT。
提供机构:
ctu-aic
原始信息汇总

数据集概述

数据特征

  • question: 字符串类型
  • answer: 字符串类型
  • turker_answer: 字符串类型
  • rule-based: 字符串类型
  • dataset: 字符串类型
  • example_uid: 字符串类型

数据分割

  • train: 包含60710个样本,占用17334203字节
  • validation: 包含10344个样本,占用2964727字节

数据大小

  • 下载大小: 15067362字节
  • 数据集大小: 20298930字节

配置

  • default:
    • train: 路径为data/train-*
    • validation: 路径为data/validation-*

许可

  • MIT

任务类别

  • text2text-generation

语言

  • sk(斯洛伐克语)

数据集名称

  • QA2D-sk

数据集规模

  • 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作