ctu-aic/qa2d-sk
收藏Hugging Face2024-03-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ctu-aic/qa2d-sk
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是斯洛伐克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为15067362字节,总大小为20298930字节。该数据集适用于文本到文本生成任务,许可证为MIT。
该数据集是斯洛伐克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为15067362字节,总大小为20298930字节。该数据集适用于文本到文本生成任务,许可证为MIT。
提供机构:
ctu-aic
原始信息汇总
数据集概述
数据特征
- question: 字符串类型
- answer: 字符串类型
- turker_answer: 字符串类型
- rule-based: 字符串类型
- dataset: 字符串类型
- example_uid: 字符串类型
数据分割
- train: 包含60710个样本,占用17334203字节
- validation: 包含10344个样本,占用2964727字节
数据大小
- 下载大小: 15067362字节
- 数据集大小: 20298930字节
配置
- default:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为
许可
- MIT
任务类别
- text2text-generation
语言
- sk(斯洛伐克语)
数据集名称
- QA2D-sk
数据集规模
- 10K<n<100K



