five

allegro/klej-dyk

收藏
Hugging Face2022-10-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/allegro/klej-dyk
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为klej-dyk,包含来自波兰维基百科的Czy wiesz...部分的近5000个问答对。每个问题由维基百科的协作者编写,并通过链接到相关维基百科文章来回答。HuggingFace版本的数据集选择了与问题具有最大令牌重叠的负样本。任务是根据给定的问题和答案预测答案是否正确。输入为问题和答案句子,输出为1(答案正确)或0(答案不正确)。数据集分为训练集和测试集,类别分布显示大部分答案是不正确的。数据集使用CC-BY-SA 3.0许可证。
提供机构:
allegro
原始信息汇总

数据集概述

名称: Did you know? (Czy wiesz?)

语言: 波兰语 (pl)

许可证: CC-BY-SA 3.0

多语言性: 单语种

大小: 1K<n<10K

来源: 原始数据

任务类别: 问答

任务ID: open-domain-qa

描述

该数据集包含约5k个问答对,来源于波兰维基百科的“Czy wiesz...”部分。每个问题由维基百科合作者撰写,并附有相关维基百科文章的链接。在HuggingFace版本中,选择了与问题具有最大令牌重叠的负面例子。

任务详情

输入: 问题和答案句子

输出: 目标列,1表示答案正确,0表示不正确

领域: 维基百科

度量标准: F1-Score

数据分割

子集 基数
训练 4154
验证 0
测试 1029

类别分布

类别 训练 验证 测试
不正确 0.831 - 0.831
正确 0.169 - 0.169

引用信息

@misc{11321/39, title = {Pytania i odpowiedzi z serwisu wikipedyjnego "Czy wiesz", wersja 1.1}, author = {Marci{ }czuk, Micha{l} and Piasecki, Dominik and Piasecki, Maciej and Radziszewski, Adam}, url = {http://hdl.handle.net/11321/39}, note = {{CLARIN}-{PL} digital repository}, year = {2013} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作