five

mteb/germanquad-retrieval

收藏
Hugging Face2025-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/germanquad-retrieval
下载链接
链接失效反馈
官方服务:
资源简介:
GermanQuAD-Retrieval是一个德语问答任务的上下文检索数据集,它是MTEB(Massive Text Embedding Benchmark)的一部分,用于评估文本嵌入模型在德语问答任务上的表现。

GermanQuAD-Retrieval is a context retrieval dataset for German question answering tasks, which is a part of MTEB (Massive Text Embedding Benchmark) used to evaluate the performance of text embedding models on German question answering tasks.
提供机构:
mteb
原始信息汇总

数据集概述

数据集配置

  • corpus:
    • 分割: corpus
    • 路径: "corpus/data-00000-of-00001.arrow"
  • queries:
    • 分割: queries
    • 路径: "queries/data-00000-of-00001.arrow"

许可

  • 许可证: cc-by-4.0

语言

  • 德语 (de)

来源数据集

  • "deepset/germanquad"

描述

  • 该数据集源自 GermanQuAD 数据集。
  • 该数据集将测试集表示为 BEIR 信息检索基准格式的语料库。
  • 添加了语料库和查询ID。
  • 相应的 qrels 可以在 这里 找到。

原始数据集引用

@misc{möller2021germanquad, title={GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval}, author={Timo Möller and Julian Risch and Malte Pietsch}, year={2021}, eprint={2104.12741}, archivePrefix={arXiv}, primaryClass={cs.CL} }

衍生数据集创建者

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作