yuri-no/miracl-ita
收藏Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/yuri-no/miracl-ita
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含查询ID、查询内容、正面段落和负面段落四个主要特征。每个段落包含文档ID、文本内容和标题。数据集分为训练集和开发集,分别包含2863和799个样本。下载大小为18824577字节,数据集总大小为31533405字节。
该数据集包含查询ID、查询内容、正面段落和负面段落四个主要特征。每个段落包含文档ID、文本内容和标题。数据集分为训练集和开发集,分别包含2863和799个样本。下载大小为18824577字节,数据集总大小为31533405字节。
提供机构:
yuri-no
原始信息汇总
数据集概述
数据集特征
- query_id:字符串类型
- query:字符串类型
- positive_passages:列表类型,包含以下子特征:
- docid:字符串类型
- text:字符串类型
- title:字符串类型
- negative_passages:列表类型,包含以下子特征:
- docid:字符串类型
- text:字符串类型
- title:字符串类型
数据集分割
- train:
- 数据量:24575489字节
- 示例数量:2863
- dev:
- 数据量:6957916字节
- 示例数量:799
数据集大小
- 下载大小:18824577字节
- 数据集总大小:31533405字节
配置文件
- default:
- train数据路径:
data/train-* - dev数据路径:
data/dev-*
- train数据路径:



