maidalun1020/CrosslingualRetrievalBooksZh2En
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maidalun1020/CrosslingualRetrievalBooksZh2En
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:查询(queries)和语料库(corpus)。查询部分包含31,172个示例,语料库部分包含4,614个示例。每个示例都有一个唯一的ID和相应的文本内容。数据集的总下载大小为7,256,648字节,总数据集大小为10,353,385字节。
该数据集包含两个主要部分:查询(queries)和语料库(corpus)。查询部分包含31,172个示例,语料库部分包含4,614个示例。每个示例都有一个唯一的ID和相应的文本内容。数据集的总下载大小为7,256,648字节,总数据集大小为10,353,385字节。
提供机构:
maidalun1020
原始信息汇总
数据集概述
许可证
- Apache 2.0
配置
- 默认配置 (
default)- 数据文件路径:
queries分割:data/queries-*corpus分割:data/corpus-*
- 数据文件路径:
数据集信息
-
特征:
id:字符串类型 (string)text:字符串类型 (string)
-
分割:
queries:- 字节数:5047639
- 样本数:31172
corpus:- 字节数:5305746
- 样本数:4614
-
下载大小:7256648 字节
-
数据集大小:10353385 字节



