mgor/xtremeup-retrieval-cross-lang-mdpr-tied-pft-nq

Name: mgor/xtremeup-retrieval-cross-lang-mdpr-tied-pft-nq
Creator: mgor
Published: 2024-04-28 19:06:28
License: 暂无描述

Hugging Face2024-04-28 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/mgor/xtremeup-retrieval-cross-lang-mdpr-tied-pft-nq

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: id dtype: string - name: title dtype: string - name: context dtype: string - name: emb sequence: float32 splits: - name: train num_bytes: 388777317 num_examples: 112426 download_size: 440121763 dataset_size: 388777317 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征： - 字段名：id，数据类型：字符串（string） - 字段名：title，数据类型：字符串（string） - 字段名：context，数据类型：字符串（string） - 字段名：emb，数据类型：由32位浮点型（float32）组成的序列数据集划分： - 划分名称：train（训练集），占用字节数：388777317，样本总量：112426 下载大小：440121763 数据集总占用大小：388777317 配置项： - 配置名称：default（默认配置），数据文件对应关系： - 划分train（训练集）对应路径：data/train-*

提供机构：

mgor

原始信息汇总

数据集概述

数据集特征

id: 数据类型为字符串。
title: 数据类型为字符串。
context: 数据类型为字符串。
emb: 数据类型为浮点数32位序列。

数据集分割

train:
- 示例数量: 112426
- 数据大小: 388777317字节

数据集大小

下载大小: 440121763字节
数据集总大小: 388777317字节

配置

default:
- 训练数据路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集