VerMouth
收藏数据集概述
名称:VerMouth
目的:用于自动生成针对在线误导性声明的个性化响应。
规模:约12,000个条目。
数据集内容
每个条目包含以下元素:
- claim:待分析的事实声明。
- fact-checking article:指向包含所有验证声明所需证据的新闻文档的链接。
- verdict:对声明的简短文本响应,解释其为何可能为真或假。
- style:指示声明表达的风格或情感的标签。
数据收集与处理
- 数据来源:基于FullFact数据集,重写了声明和裁决。
- 处理方法:采用作者-审稿人流程,结合基于指令的大型语言模型和人工后期编辑。
数据风格
数据根据两种风格重写:
- SMP style:模仿社交媒体平台(尤其是Twitter)的风格。
- Emotional style:在社交媒体沟通风格基础上增加情感成分,包括六种基本情感:愤怒、惊讶、厌恶、享受、恐惧和悲伤。
数据分布
- SMP-style:1838项
- Emotional style:总计10,152项,细分如下:
- 幸福:1527项
- 愤怒:1590项
- 恐惧:1805项
- 厌恶:1675项
- 悲伤:1758项
- 惊讶:1797项
文件描述
数据集在data文件夹中分为_train_, val, 和 test 集。每个条目包括_id_, claim, verdict, 指向FullFact事实检查文章的_link_, 以及_style label_。
引用信息
若使用此数据集,请引用以下文献:
bibtex @inproceedings{russo-etal-2023-countering, title = "Countering Misinformation via Emotional Response Generation", author = "Russo, Daniel and Kaszefski-Yaschuk, Shane and Staiano, Jacopo and Guerini, Marco", editor = "Bouamor, Houda and Pino, Juan and Bali, Kalika", booktitle = "Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing", month = dec, year = "2023", address = "Singapore", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.emnlp-main.703", doi = "10.18653/v1/2023.emnlp-main.703", pages = "11476--11492", }
许可
VerMouth数据集仅供研究使用,不可重新分发。使用时需引用相关出版物。




