MSVEC
收藏github2024-05-17 更新2024-05-31 收录
下载链接:
https://github.com/lamps-lab/msvec
下载链接
链接失效反馈官方服务:
资源简介:
MSVEC数据集,即多领域科学声明验证评估语料库,涵盖了多个领域的真实和虚假证据科学声明,旨在评估科学声明验证模型的鲁棒性。
The MSVEC dataset, also known as the Multi-domain Scientific Claim Verification Evaluation Corpus, encompasses a wide range of true and false scientific claims across various domains. It is designed to assess the robustness of models in verifying scientific claims.
创建时间:
2023-02-19
原始信息汇总
数据集概述
数据集名称
- MSVEC (Multi-Domain Scientific Claim Verification Evaluation Corpus)
数据集描述
- 目的:评估SCV(Scientific Claim Verification)模型的鲁棒性。
- 内容:包含56个科学声明,来源于Snopes.com和Politifact.com,涉及多个领域如生物学、医学、空间科学、地质学、政治和与Covid相关的声明。每个声明都有专家验证的真伪标签,并附有一篇支持或反驳该声明的研究论文。
- 数据量:包含5,244篇论文的摘要和元数据(标题、作者、年份)。
相关数据集
- SciFact:包含1,409个科学声明,与5,183篇摘要相关联,每个声明都有支持或反驳的摘要句子。
- HealthVer:包含14,330个健康相关的声明和证据对,主要从TREC-COVID中提取,每个声明都与CORD-19的摘要进行了验证。
- CovidFact:包含4,086个从Reddit提取的声明,通过CORD-19和其他网络资源进行验证。
评估结果
- GPT-3.5:在抽象相关性评估中,近半数预测为假阳性,导致低精确度和整体F1分数为0.48。
- MultiVerS:在多个数据集上进行评估,显示在相似领域内训练和评估的模型表现更好。然而,所有模型在MSVEC数据集上的表现较差,F1分数在0.05至0.14之间。
任务类型
- 抽象标签任务:使用GPT-3.5评估抽象与声明的相关性,并标记抽象是否支持、反驳或无关。
- 句子标签任务:在抽象中寻找句子理由,评估模型在不同数据集上的泛化能力。
搜集汇总
数据集介绍

构建方式
MSVEC数据集的构建基于多个领域的科学声明验证任务,涵盖了真实和虚假的科学声明。该数据集从Snopes.com和Politifact.com等网站获取了56条科学声明,并由专家手动验证其真实性标签。每条声明均由一篇支持或反驳的研究论文作为依据,这些论文来自SciFact数据集中的5,244篇论文。通过这种方式,MSVEC数据集不仅确保了数据的多样性,还增强了其在多领域科学声明验证任务中的适用性。
特点
MSVEC数据集的显著特点在于其跨领域的广泛覆盖,涉及生物学、医学、空间科学、地质学、政治学以及与新冠疫情相关的声明。每条声明均与一篇研究论文相关联,确保了数据的高质量和对科学声明验证任务的针对性。此外,数据集中的声明和论文均附有详细的元数据,包括标题、作者和年份,这为模型的训练和评估提供了丰富的上下文信息。
使用方法
MSVEC数据集主要用于评估科学声明验证(SCV)模型的鲁棒性。用户可以通过提供的声明和相关论文的摘要,训练模型以识别声明的真实性。具体使用时,可以将声明与论文摘要进行嵌入处理,计算其相似度,并根据模型的输出判断声明的支持、反驳或无关性。此外,数据集还支持多任务学习,包括抽象相关性和句子标签标注,以进一步提升模型的性能和泛化能力。
背景与挑战
背景概述
MSVEC数据集,即多领域科学声明验证评估语料库,由研究人员开发,旨在评估科学声明验证(SCV)模型在多领域中的鲁棒性。该数据集涵盖了多个领域的真实和虚假科学声明,并由专家手动验证其真实性标签。MSVEC数据集的构建基于从Snopes.com和Politifact.com获取的56条科学声明,并附有支持或反驳这些声明的研究论文。该数据集的领域包括生物学、医学、空间科学、地质学、政治学以及与新冠疫情相关的声明。MSVEC的推出为多领域科学声明验证任务提供了新的基准,推动了该领域的研究进展。
当前挑战
MSVEC数据集在构建和应用过程中面临多项挑战。首先,多领域科学声明的验证任务本身具有高度复杂性,要求模型具备跨领域的知识理解和推理能力。其次,数据集的构建涉及从大量研究论文中筛选相关文献,并确保其与声明的关联性,这一过程需要耗费大量的人力和时间。此外,现有的SCV模型在MSVEC数据集上的表现普遍不佳,显示出模型在跨领域泛化能力上的不足。具体表现为,模型在处理不同领域的声明时,难以保持一致的高精度,导致F1分数较低。这些挑战表明,当前的SCV模型在处理多领域科学声明验证任务时仍需进一步优化和改进。
常用场景
经典使用场景
MSVEC数据集在多领域科学声明验证任务中展现了其经典应用场景。该数据集通过涵盖真实与虚假的科学声明,旨在评估科学声明验证(SCV)模型在多领域环境下的鲁棒性。研究者利用MSVEC数据集对GPT-3.5和MultiVerS模型进行评估,以探索这些模型在处理跨学科科学声明时的表现。
解决学术问题
MSVEC数据集解决了科学声明验证领域中的一个关键学术问题,即如何在多领域环境下评估和提升模型的泛化能力。通过提供跨学科的真实与虚假声明,MSVEC帮助研究者识别现有模型在不同领域中的局限性,从而推动更鲁棒和通用的SCV模型的发展。
衍生相关工作
MSVEC数据集的发布激发了一系列相关研究工作,特别是在跨领域科学声明验证模型的开发与评估方面。例如,研究者基于MSVEC数据集开发了新的模型训练策略,以提高模型在多领域环境下的表现。此外,MSVEC还促进了与其他相关数据集(如SciFact、HealthVer和Covid-Fact)的比较研究,进一步推动了SCV领域的技术进步。
以上内容由遇见数据集搜集并总结生成



