ctu-aic/qa2d-cs
收藏Hugging Face2024-03-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ctu-aic/qa2d-cs
下载链接
链接失效反馈官方服务:
资源简介:
QA2D-cs数据集是捷克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。该数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为14891492字节,总数据集大小为20205801字节。该数据集适用于文本到文本生成任务,语言为捷克语。
QA2D-cs数据集是捷克语版本的Question to Declarative Sentence (QA2D),使用DeepL服务进行机器翻译。该数据集包含问题、答案、Turker答案、基于规则的答案、数据集和示例唯一标识符等特征。数据集分为训练集和验证集,分别包含60710和10344个示例。数据集的总下载大小为14891492字节,总数据集大小为20205801字节。该数据集适用于文本到文本生成任务,语言为捷克语。
提供机构:
ctu-aic
原始信息汇总
数据集概述
特征信息
- 问题:类型为字符串
- 答案:类型为字符串
- turker答案:类型为字符串
- 基于规则:类型为字符串
- 数据集:类型为字符串
- 示例UID:类型为字符串
数据分割
- 训练集:
- 字节数:17257995
- 样本数:60710
- 验证集:
- 字节数:2947806
- 样本数:10344
数据大小
- 下载大小:14891492
- 数据集大小:20205801
配置
- 默认配置:
- 训练集路径:data/train-*
- 验证集路径:data/validation-*
许可证
- MIT许可证
任务类别
- 文本生成
语言
- 捷克语
数据集名称
- QA2D-cs
数据集规模
- 10K<n<100K



