CHEW
收藏arXiv2024-06-27 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2406.19116v1
下载链接
链接失效反馈官方服务:
资源简介:
CHEW数据集由卡迪夫大学创建,专注于捕捉Wikipedia中事件和实体的自然变化。该数据集包含从Wikipedia列表中提取的时间标记的事件和实体,用于研究语言模型在时间理解上的能力。数据集的构建过程涉及从TAQA数据集中提取时间相关的问答对,并通过计算文本相似度来筛选出显著变化的事件。CHEW数据集主要用于评估和提升语言模型在处理时间信息和变化检测方面的性能。
The CHEW Dataset, created by Cardiff University, focuses on capturing natural changes of events and entities within Wikipedia. This dataset contains time-stamped events and entities extracted from Wikipedia lists, and is used to investigate the temporal understanding capabilities of language models. The construction of this dataset involves extracting time-related question-answer pairs from the TAQA Dataset, and filtering out events with significant changes via text similarity calculation. The CHEW Dataset is primarily used to evaluate and improve the performance of language models in handling temporal information and change detection tasks.
提供机构:
卡迪夫大学计算机科学与信息学院
创建时间:
2024-06-27
搜集汇总
数据集介绍

构建方式
CHEW数据集的构建基于维基百科中实体和事件的动态变化。首先,从TAQA数据集中提取具有时间戳的问题-答案对,并筛选出答案在不同时间戳之间存在差异的实体对。然后,获取这些实体对在两个时间戳对应的维基百科页面版本,并计算它们之间的余弦相似度。通过设定相似度阈值,筛选出确实反映了重要变化的页面对,形成正例集P。同时,通过采样高编辑频率的维基百科页面的首尾版本,并计算其定义句子的相似度,筛选出没有显著变化的页面对,形成负例集N。最终,CHEW数据集包含了反映实体随时间变化的正例和负例,为研究语言模型的时间理解能力提供了基础。
特点
CHEW数据集具有以下特点:首先,数据集聚焦于实体和事件的时间变化,通过对比不同时间点的页面内容,揭示了实体随时间演变的过程。其次,数据集包含正负例,正例反映了实体的重要变化,而负例则反映了实体内容上的细微差异。此外,数据集涵盖了多种领域和实体,具有较高的多样性和实用性。
使用方法
CHEW数据集可用于评估和改进语言模型对时间信息的处理能力。具体使用方法包括:1. 通过提示语言模型生成实体随时间变化的信息,并评估其生成内容与真实变化的相似度。2. 通过提示语言模型对实体内容进行分类,判断是否存在显著变化。3. 将数据集用于微调语言模型,提升其处理时间信息的能力。CHEW数据集为研究语言模型的时间理解和处理能力提供了有力工具。
背景与挑战
背景概述
CHEW数据集,全称为CHanging Events in Wikipedia,是一个基于维基百科中自然发生的文本表达变化的创新数据集。该数据集由Hsuvas Borkakoty和Luis Espinosa-Anke等研究人员创建,旨在研究语言模型(LMs)在时间线理解上的能力。CHEW数据集的创建基于维基百科事件和实体的时间序列变化,通过生成和分类实验,揭示了LMs在构建准确时间线方面的困难。此外,CHEW数据集的嵌入对于识别语义变化也显示出其有用性。该数据集的引入为研究语言模型的时间序列知识表示和变化建模提供了重要的基准数据,并对相关领域的研究产生了积极影响。
当前挑战
CHEW数据集在研究过程中面临的主要挑战包括:1) 语言模型在时间线理解上的困难,即LMs在处理时间信息时存在时间错位的问题;2) 构建过程中遇到的挑战,如如何从维基百科中准确提取事件和实体的时间序列变化,并确保这些变化对实体和事件的意义产生重要影响。此外,CHEW数据集的创建者也在伦理声明中提出了更新LLMs知识时可能遇到的问题,如与维基百科质量标准的冲突以及可能引发的信息不实问题。这些问题都需要在未来的研究中进一步探索和解决。
常用场景
经典使用场景
CHEW数据集主要用于评估大型语言模型(LLMs)在理解和处理时间序列信息方面的能力。通过分析维基百科中实体和事件随时间的变化,CHEW能够帮助研究者探索LLMs在构建准确时间线方面的能力。此外,CHEW还用于研究意义转变,为LLMs的时间对齐提供了新的视角。
实际应用
CHEW数据集在实际应用中可以帮助LLMs更好地理解和处理时间序列信息。例如,在新闻摘要、事件追踪、历史数据分析等领域,CHEW可以帮助LLMs更好地理解事件的发展脉络,从而提高LLMs在这些领域的应用效果。
衍生相关工作
CHEW数据集的提出引发了一系列相关研究,如TemporalWiki等。这些研究进一步探讨了LLMs在时间序列信息处理方面的能力,为LLMs的时间对齐提供了新的思路。此外,CHEW数据集还为LLMs的预训练提供了新的数据来源,有助于提高LLMs在时间序列信息处理方面的能力。
以上内容由遇见数据集搜集并总结生成



