maidalun1020/CrosslingualRetrievalQasEn2Zh
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maidalun1020/CrosslingualRetrievalQasEn2Zh
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:queries和corpus。queries部分包含20,000个示例,总大小为2,986,406字节;corpus部分包含79,955个示例,总大小为63,916,553字节。每个数据条目包含两个特征:id(字符串类型)和text(字符串类型)。整个数据集的下载大小为40,536,276字节,数据集总大小为66,902,959字节。
该数据集包含两个主要部分:queries和corpus。queries部分包含20,000个示例,总大小为2,986,406字节;corpus部分包含79,955个示例,总大小为63,916,553字节。每个数据条目包含两个特征:id(字符串类型)和text(字符串类型)。整个数据集的下载大小为40,536,276字节,数据集总大小为66,902,959字节。
提供机构:
maidalun1020
原始信息汇总
数据集概述
许可证
- Apache 2.0
配置
- 默认配置 (
default)- 数据文件:
- 查询 (
queries):data/queries-* - 语料库 (
corpus):data/corpus-*
- 查询 (
- 数据文件:
数据集信息
-
特征:
id: 字符串类型 (string)text: 字符串类型 (string)
-
分割:
- 查询 (
queries):- 字节数: 2986406
- 样本数: 20000
- 语料库 (
corpus):- 字节数: 63916553
- 样本数: 79955
- 查询 (
-
下载大小: 40536276 字节
-
数据集大小: 66902959 字节



