five

jinaai/spanish_passage_retrieval

收藏
Hugging Face2024-02-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jinaai/spanish_passage_retrieval
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集提供了西班牙语段落检索任务的数据,包含两种检索任务版本:S2S(检索被标记为相关的段落/句子)和S2P(检索包含相关段落/句子的文档)。相应的语料库分别称为`corpus.sentences`和`corpus.documents`。相关的qrel数据存储在`qrels.s2s`和`qrels.s2p`中,这些文件包含以空格分隔的相关文档列表。该数据集来源于https://mklab.iti.gr/results/spanish-passage-retrieval-dataset/,并在HuggingFace平台上提供。
提供机构:
jinaai
原始信息汇总

Spanish Passage Retrieval 数据集概述

数据集描述

该数据集用于西班牙语段落检索任务,包含两种版本:

  • S2S:检索标记为相关的段落/句子。
  • S2P:检索包含相关段落/句子的文档。

数据文件

  • 语料库
    • corpus.sentences:用于S2S任务的语料库。
    • corpus.documents:用于S2P任务的语料库。
  • 相关性数据
    • qrels.s2s:包含S2S任务的相关文档列表。
    • qrels.s2p:包含S2P任务的相关文档列表。

引用信息

@inbook{inbook, author = {Kamateri, Eleni and Tsikrika, Theodora and Symeonidis, Spyridon and Vrochidis, Stefanos and Minker, Wolfgang and Kompatsiaris, Ioannis}, year = {2019}, month = {04}, pages = {148-154}, title = {A Test Collection for Passage Retrieval Evaluation of Spanish Health-Related Resources}, isbn = {978-3-030-15718-0}, doi = {10.1007/978-3-030-15719-7_19} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作