d0rj/RuBQ_1.0
收藏Hugging Face2023-09-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/RuBQ_1.0
下载链接
链接失效反馈官方服务:
资源简介:
RuBQ 1.0是一个用于Wikidata上的问答任务的俄语数据集。该数据集包含测试集和开发集,每个样本包含唯一标识符、问题文本、查询、答案文本、问题URI、问题属性、答案列表、标签和英文问题等特征。数据集的大小在1K到10K之间,适用于机器阅读理解任务。
提供机构:
d0rj
原始信息汇总
RuBQ 1.0 数据集概述
数据集配置
- 默认配置 (
default)- 数据文件路径
- 测试集 (
test):data/test-* - 开发集 (
dev):data/dev-*
- 测试集 (
- 数据文件路径
数据集信息
-
特征 (
features)uid: 数据类型为int64question_text: 数据类型为stringquery: 数据类型为stringanswer_text: 数据类型为stringquestion_uris: 序列类型为stringquestion_props: 序列类型为stringanswers: 列表类型datatype: 数据类型为stringtype: 数据类型为stringvalue: 数据类型为stringxml:lang: 数据类型为string
tags: 序列类型为stringquestion_eng: 数据类型为string
-
数据集划分 (
splits)- 测试集 (
test)- 字节数: 472281
- 样本数: 1200
- 开发集 (
dev)- 字节数: 115029
- 样本数: 300
- 测试集 (
-
数据集大小
- 下载大小: 249954 字节
- 数据集大小: 587310 字节
-
许可证
cc-by-sa-4.0
-
任务类别
- 问答 (
question-answering)
- 问答 (
-
语言
- 俄语 (
ru) - 英语 (
en)
- 俄语 (
-
标签
qamachine reading
-
数据源
- 原始数据 (
original)
- 原始数据 (
-
数据集名称
RuBQ 1.0
-
数据集规模
1K<n<10K
-
Papers with Code ID
rubq



