five

WikiContradiction

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/WikiContradiction
下载链接
链接失效反馈
官方服务:
资源简介:
虽然维基百科已被用于事实检查和声明验证以揭穿错误信息和虚假信息,但提高文章质量并排除嘈杂文章至关重要。自相矛盾是维基百科中的低质量文章类型之一。在这项工作中,我们提出了一项检测维基百科中自相矛盾的文章的任务。基于“自相矛盾”模板,我们为自相矛盾检测任务创建了一个新颖的数据集。传统的矛盾检测侧重于比较成对的句子或声明,但自我矛盾检测需要进一步推理文章的语义,同时从所有成对的句子中学习矛盾感知的比较。因此,我们提出了第一个模型,Pairwise Contradiction Neural Network (PCNN),不仅可以有效识别自相矛盾的文章,还可以突出矛盾句子中最矛盾的对。 PCNN 的主要思想有两个。首先,为了减轻数据稀缺对自相矛盾文章的影响,我们使用 SNLI 和 MNLI 基准对成对矛盾学习模块进行了预训练。其次,我们选择矛盾概率值最高的前 K 个句子对,并对它们的相关性进行建模,以确定相应的文章是否属于自相矛盾。在提出的 WikiContradiction 数据集上进行的实验表明,PCNN 可以产生有希望的性能并全面突出矛盾所在的句子对。
提供机构:
OpenDataLab
创建时间:
2022-09-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作