mzasada/poquad_v2
收藏Hugging Face2024-01-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mzasada/poquad_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于问答任务,支持SQuADv1和SQuADv2类型的模型,特别是解锁了poquad中的空问题特性。数据集的语言为波兰语,大小在10K到100K之间。
该数据集主要用于问答任务,支持SQuADv1和SQuADv2类型的模型,特别是解锁了poquad中的空问题特性。数据集的语言为波兰语,大小在10K到100K之间。
提供机构:
mzasada
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
-
特征:
id:字符串类型title:字符串类型context:字符串类型question:字符串类型is_impossible:字符串类型answers:序列类型,包含以下子特征:text:字符串类型answer_start:32位整数类型generative_answer:字符串类型
-
数据分割:
train:- 字节数:66007405
- 样本数:56618
validation:- 字节数:8303914
- 样本数:7060
-
数据大小:
- 下载大小:16398725 字节
- 数据集大小:74311319 字节
配置
- 默认配置:
- 数据文件:
train:路径为data/train-*validation:路径为data/validation-*
- 数据文件:
任务类别
- 问答(question-answering)
语言
- 波兰语(pl)
数据集大小类别
- 10K < n < 100K



