five

germandpr

收藏
huggingface.co2025-03-24 收录
下载链接:
https://huggingface.co/datasets/deepset/germandpr
下载链接
链接失效反馈
官方服务:
资源简介:
We take GermanQuAD as a starting point and add hard negatives from a dump of the full German Wikipedia following the approach of the DPR authors (Karpukhin et al., 2020). The format of the dataset also resembles the one of DPR. GermanDPR comprises 9275 question/answer pairs in the training set and 1025 pairs in the test set. For each pair, there are one positive context and three hard negative contexts.

本研究以 GermanQuAD 为基础,并遵循 DPR 作者(Karpukhin 等人,2020 年)的方法,从完整德语维基百科的数据库中添加了硬负样本。该数据集的格式亦与 DPR 类似。GermanDPR 包含 9275 对训练集中的问题和答案,以及 1025 对测试集中的问题和答案。对于每一对问答,均包含一个正样本上下文和三个硬负样本上下文。
提供机构:
huggingface.co
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作