five

clips/beir-nl-dbpedia-entity

收藏
Hugging Face2025-02-10 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/clips/beir-nl-dbpedia-entity
下载链接
链接失效反馈
官方服务:
资源简介:
BEIR-NL是一个荷兰语版本的BEIR基准测试,涵盖了从生物医学、金融文本到一般网络内容的各种领域。数据集包含多个任务,如事实核查、问答、生物医学信息检索、论点检索、重复问题检索、引用预测和实体检索。数据集结构包括corpus、queries和qrels文件,分别用于存储文档、查询和查询文档相关性判断。数据集的创建目的是为了促进荷兰语信息检索模型的发展,通过自动翻译BEIR数据集来实现。然而,数据集存在一些局限性,如缺乏原生荷兰语资源、数据污染问题以及基准测试的有效性随时间变化的风险。

BEIR-NL is a Dutch-translated version of the BEIR benchmark, covering various tasks and domains including fact-checking, question-answering, bio-medical IR, argument retrieval, duplicate question retrieval, citation-prediction, and entity retrieval. The dataset includes corpus, queries, and qrels files, all in JSONL format. BEIR-NL is designed for zero-shot evaluation of information retrieval models in Dutch, addressing the need for benchmarks in underrepresented languages. The creation of the dataset includes the translation process and discusses known limitations, such as the reliance on translated data rather than native Dutch resources. Licensing information and citation details are also provided.
提供机构:
clips
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作