maidalun1020/CrosslingualRetrievalOthersEn2Zh
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maidalun1020/CrosslingualRetrievalOthersEn2Zh
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:queries和corpus。queries部分包含22,959个示例,大小为4,629,552字节;corpus部分包含3,919个示例,大小为3,726,790字节。整个数据集的下载大小为6,216,012字节,总大小为8,356,342字节。数据集的特征包括id和text,均为字符串类型。
该数据集包含两个主要部分:queries和corpus。queries部分包含22,959个示例,大小为4,629,552字节;corpus部分包含3,919个示例,大小为3,726,790字节。整个数据集的下载大小为6,216,012字节,总大小为8,356,342字节。数据集的特征包括id和text,均为字符串类型。
提供机构:
maidalun1020
原始信息汇总
数据集概述
许可证
- Apache 2.0
配置
- 默认配置 (
default)- 数据文件:
- 查询 (
queries):data/queries-* - 语料库 (
corpus):data/corpus-*
- 查询 (
- 数据文件:
数据集信息
- 特征:
id: 字符串类型 (string)text: 字符串类型 (string)
- 分割:
- 查询 (
queries):- 字节数: 4629552
- 样本数: 22959
- 语料库 (
corpus):- 字节数: 3726790
- 样本数: 3919
- 查询 (
- 下载大小: 6216012 字节
- 数据集大小: 8356342 字节



