five

TabFact|事实验证数据集|自然语言理解数据集

收藏
arXiv2020-06-15 更新2024-06-21 收录
事实验证
自然语言理解
下载链接:
https://github.com/wenhuchen/Table-Fact-Checking
下载链接
链接失效反馈
资源简介:
TabFact是一个大规模的数据集,用于基于表格的事实验证。该数据集由加州大学圣巴巴拉分校和腾讯AI Lab创建,包含16,000个维基百科表格作为证据,用于验证118,000个人工标注的自然语言陈述,这些陈述被标记为'ENTAILED'或'REFUTED'。TabFact的挑战在于它涉及软语言推理和硬符号推理。数据集创建过程中,通过众包方式收集了不同难度级别的陈述,并进行了质量控制以确保数据的准确性。TabFact的应用领域包括自然语言理解和语义表示的研究,旨在解决基于结构化证据的事实验证问题。
提供机构:
加州大学圣巴巴拉分校
创建时间:
2019-09-05
AI搜集汇总
数据集介绍
main_image_url
构建方式
TabFact数据集的构建基于16,000个维基百科表格,这些表格作为证据用于验证118,000条人工标注的自然语言陈述。这些陈述被标记为‘ENTAILED’或‘REFUTED’。数据集的构建过程包括从维基百科中提取表格,并通过众包平台Amazon Mechanical Turk进行人工标注。标注过程中,采用了‘positive two-channel collection’和‘negative rewriting strategy’来确保数据质量,同时通过质量控制措施进一步筛选和过滤标注数据。
特点
TabFact数据集的特点在于其结合了软语言推理和硬符号推理,这使得数据集具有挑战性。数据集中的陈述不仅需要理解表格中的信息,还需要进行复杂的逻辑推理。此外,数据集通过设计两种不同的标注渠道(简单和复杂)来收集不同难度的陈述,从而更好地评估模型的性能。
使用方法
TabFact数据集可用于训练和评估基于表格的事实验证模型。研究者可以使用数据集中的表格和陈述对模型进行训练,并通过验证集和测试集来评估模型的性能。数据集还提供了两种不同的模型(Table-BERT和Latent Program Algorithm)作为参考,研究者可以在此基础上进行改进和创新。数据集的代码和数据可在GitHub上获取,便于进一步的研究和应用。
背景与挑战
背景概述
TabFact, introduced in 2020 by researchers from the University of California, Santa Barbara, and Tencent AI Lab, addresses the critical challenge of fact verification using semi-structured data, specifically tables. The dataset comprises 118,000 human-annotated statements derived from 16,000 Wikipedia tables, classified as either ENTAILED or REFUTED. This initiative fills a significant gap in the field of natural language understanding, where previous studies primarily focused on unstructured evidence. TabFact's creation underscores the importance of structured data in real-world applications, such as database systems and dialog systems, and its impact on advancing AI's ability to reason over both linguistic and symbolic forms.
当前挑战
TabFact presents several challenges. Firstly, it requires the integration of soft linguistic reasoning with hard symbolic reasoning, necessitating models that can handle both semantic understanding and structured data execution. Secondly, the dataset's construction faced difficulties in ensuring high-quality human annotations, managing annotation artifacts, and maintaining inter-annotator agreement. Thirdly, the models designed to tackle TabFact, such as Table-BERT and Latent Program Algorithm (LPA), must overcome the limitations of existing pre-trained language models in handling structured data and the complexities of program synthesis. These challenges highlight the need for innovative approaches that can effectively bridge linguistic and symbolic reasoning in AI systems.
常用场景
经典使用场景
TabFact 数据集的经典使用场景在于基于半结构化表格的事实验证任务。该数据集通过提供 16k 维基百科表格和 118k 人工标注的自然语言陈述,支持模型判断陈述是否被表格内容所支持或反驳。这种场景特别适用于需要软语言推理和硬符号推理相结合的任务,如自然语言推理和语义表示。
解决学术问题
TabFact 数据集解决了在结构化证据(如表格、图表和数据库)下进行事实验证的学术研究问题。传统研究主要集中在非结构化证据(如自然语言句子和文档),而结构化证据下的验证研究相对不足。TabFact 通过提供大规模的半结构化数据,推动了这一领域的研究进展,对于提升自然语言理解和语义表示具有重要意义。
衍生相关工作
TabFact 数据集的提出催生了一系列相关研究工作,特别是在基于表格的事实验证和自然语言推理领域。例如,研究者们开发了 Table-BERT 和 Latent Program Algorithm (LPA) 等模型,这些模型利用预训练语言模型和符号执行技术来处理表格数据。此外,TabFact 还促进了在多模态语言推理和程序合成与语义解析等方向的研究。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

CRSP Stock Database

CRSP Stock Database包含美国股票市场的历史数据,涵盖了股票价格、交易量、分红、拆股等信息。该数据库广泛用于金融研究,特别是资产定价和市场效率的研究。

www.crsp.org 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

MID-Ship

MID-Ship是一个用于复杂海上船舶导航行为的数据集,由上海海事大学创建,旨在解决船舶目标检测中的遮挡和密集交互问题。该数据集包含5673张图像,总计135,884个精细标注的目标实例,涵盖多种海上场景,如不同天气条件下的船舶相遇、靠泊操作、小目标聚集和部分遮挡等。数据集通过高分辨率视频片段采集,覆盖43个不同的可航水域,并包含多种天气和光照条件,增强了数据集的多样性和实用性。MID-Ship主要应用于智能海上交通监控系统和自主船舶导航,旨在提高复杂环境下的船舶检测和跟踪能力,减少海上事故。

arXiv 收录