d0rj/RuBQ_2.0-paragraphs
收藏Hugging Face2023-09-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/RuBQ_2.0-paragraphs
下载链接
链接失效反馈官方服务:
资源简介:
RuBQ 2.0是一个用于问答任务的数据集,特别针对Wikidata上的俄语问答。该数据集包含段落级别的数据,适用于机器阅读理解任务。数据集的存储库和相关论文可以在提供的链接中找到。
提供机构:
d0rj
原始信息汇总
数据集概述
数据集信息
配置
- 配置名称: default
- 数据文件:
- 分割: paragraphs
- 路径: data/paragraphs-*
特征
- 名称: uid
- 数据类型: int64
- 名称: ru_wiki_pageid
- 数据类型: int64
- 名称: text
- 数据类型: string
分割
- 名称: paragraphs
- 字节数: 47303369
- 样本数: 56952
大小
- 下载大小: 24269133
- 数据集大小: 47303369
许可
- 许可: cc-by-sa-4.0
任务类别
- 任务类别: question-answering
语言
- 语言: ru, en
标签
- 标签: qa, machine reading
来源数据集
- 来源数据集: original
名称
- 名称: RuBQ 2.0
大小类别
- 大小类别: 10K<n<100K
论文ID
- 论文ID: rubq



