maidalun1020/CrosslingualRetrievalFinanceEn2Zh
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maidalun1020/CrosslingualRetrievalFinanceEn2Zh
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:查询(queries)和语料库(corpus)。查询部分包含25,045个示例,语料库部分包含4,668个示例。每个示例都有一个唯一的ID和相应的文本内容。数据集可能用于信息检索或自然语言处理任务,其中查询部分可能代表用户的搜索请求,而语料库部分可能包含待检索的文档或信息。
该数据集包含两个主要部分:查询(queries)和语料库(corpus)。查询部分包含25,045个示例,语料库部分包含4,668个示例。每个示例都有一个唯一的ID和相应的文本内容。数据集可能用于信息检索或自然语言处理任务,其中查询部分可能代表用户的搜索请求,而语料库部分可能包含待检索的文档或信息。
提供机构:
maidalun1020
原始信息汇总
数据集概述
许可证
- Apache 2.0
配置
- 默认配置 (
default)- 数据文件路径:
queries分割:data/queries-*corpus分割:data/corpus-*
- 数据文件路径:
数据集信息
- 特征:
id: 数据类型为stringtext: 数据类型为string
- 分割:
queries:- 字节数: 6378768
- 样本数: 25045
corpus:- 字节数: 4307523
- 样本数: 4668
- 下载大小: 6723628 字节
- 数据集大小: 10686291 字节



