germandpr
收藏huggingface.co2025-03-24 收录
下载链接:
https://huggingface.co/datasets/deepset/germandpr
下载链接
链接失效反馈官方服务:
资源简介:
We take GermanQuAD as a starting point and add hard negatives from a dump of the full German Wikipedia following the approach of the DPR authors (Karpukhin et al., 2020). The format of the dataset also resembles the one of DPR. GermanDPR comprises 9275 question/answer pairs in the training set and 1025 pairs in the test set. For each pair, there are one positive context and three hard negative contexts.
本研究以 GermanQuAD 为基础,并遵循 DPR 作者(Karpukhin 等人,2020 年)的方法,从完整德语维基百科的数据库中添加了硬负样本。该数据集的格式亦与 DPR 类似。GermanDPR 包含 9275 对训练集中的问题和答案,以及 1025 对测试集中的问题和答案。对于每一对问答,均包含一个正样本上下文和三个硬负样本上下文。
提供机构:
huggingface.co



