mteb/germanquad-retrieval
收藏Hugging Face2025-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/germanquad-retrieval
下载链接
链接失效反馈官方服务:
资源简介:
GermanQuAD-Retrieval是一个德语问答任务的上下文检索数据集,它是MTEB(Massive Text Embedding Benchmark)的一部分,用于评估文本嵌入模型在德语问答任务上的表现。
GermanQuAD-Retrieval is a context retrieval dataset for German question answering tasks, which is a part of MTEB (Massive Text Embedding Benchmark) used to evaluate the performance of text embedding models on German question answering tasks.
提供机构:
mteb
原始信息汇总
数据集概述
数据集配置
- corpus:
- 分割: corpus
- 路径: "corpus/data-00000-of-00001.arrow"
- queries:
- 分割: queries
- 路径: "queries/data-00000-of-00001.arrow"
许可
- 许可证: cc-by-4.0
语言
- 德语 (de)
来源数据集
- "deepset/germanquad"
描述
- 该数据集源自 GermanQuAD 数据集。
- 该数据集将测试集表示为 BEIR 信息检索基准格式的语料库。
- 添加了语料库和查询ID。
- 相应的 qrels 可以在 这里 找到。
原始数据集引用
@misc{möller2021germanquad, title={GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval}, author={Timo Möller and Julian Risch and Malte Pietsch}, year={2021}, eprint={2104.12741}, archivePrefix={arXiv}, primaryClass={cs.CL} }



