mpkato/miracl-japanese-small
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mpkato/miracl-japanese-small
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含查询ID、查询内容、正面段落和负面段落。正面段落和负面段落均包含文档ID、文本和标题。数据集分为训练集和开发集,分别包含3292和860个示例。训练集文件大小为29193126字节,开发集文件大小为7114857字节。总下载大小为21188455字节,总数据集大小为36307983字节。
该数据集包含查询ID、查询内容、正面段落和负面段落。正面段落和负面段落均包含文档ID、文本和标题。数据集分为训练集和开发集,分别包含3292和860个示例。训练集文件大小为29193126字节,开发集文件大小为7114857字节。总下载大小为21188455字节,总数据集大小为36307983字节。
提供机构:
mpkato
原始信息汇总
数据集概述
数据集特征
- query_id: 数据类型为字符串。
- query: 数据类型为字符串。
- positive_passages: 包含以下子特征:
- docid: 数据类型为字符串。
- text: 数据类型为字符串。
- title: 数据类型为字符串。
- negative_passages: 包含以下子特征:
- docid: 数据类型为字符串。
- text: 数据类型为字符串。
- title: 数据类型为字符串。
数据集分割
- train:
- 数据大小: 29193126 字节
- 示例数量: 3292
- dev:
- 数据大小: 7114857 字节
- 示例数量: 860
数据集大小
- 下载大小: 21188455 字节
- 数据集总大小: 36307983 字节
配置文件
- config_name: default
- data_files:
- split: train, 文件路径: data/train-*
- split: dev, 文件路径: data/dev-*



